Duplicate werden nicht erkannt !


#1

Guten Morgen,
ich musste vor ca. 2 Wochen 3 Datenbanken (gesamt 13000 Dateien) neu aufbauen, dabei dacht ich mir das ich aus 3 Datenbanken 2 mache!

Mir war bewußt, das ich viele Doppelte Dateien haben werde, aber ich dacht auch habe ja ein schlaues System :wink:

Ist aber wohl doch nicht so, oder es liegt an mir :blush:

Seit 1 Woche baue ich jetzt die beiden Datenbanken neu auf und immer wieder finde ich selbst Dateien die noch 3,4 oder 5 mal im System vorhanden sind!

Warum?
Ich nutze Duplikate finden, aber nichts wird mehr angezeigt!

Ist es für das System so schwer folgenden Daten zu erkennen:
2016_08_14_18_13_43.pdf
2016_08_14_18_13_43 2.pdf
2016_08_14_18_13_43 2.pdf
2016_08_14_18_13_43-2.pdf
2016_08_14_18_13_43 4.pdf
2016_08_14_18_13_43-4.pdf
und alle Dateien mit einer große von ca. 32,8 MB und Sie liegen in der selben Gruppe :blush:

Erst dachte ich gut dann lösche ich die mal eben von Hand, das habe ich jetzt aber bestimmt schon bei 1000 Dateien gemacht!

Nun habe ich aber keine Lust mehr!

Habe ich eine Funktion bei DevonThink Pro übersehen?
Freue mich über Tipps


#2

Der Dateiname spielt keine Rolle, nur der Inhalt der Dokumente. Enthalten diese PDF-Dokumente denn irgendwelchen Text?

D.h. die intelligente Gruppe “Duplikate” oder eine andere Funktion?


#3

Hallo,

alle Dateien fangen mit dem selben Dokument an, haben alle 173 Seiten und enden auch mit dem selben Dokument!

Anbei ein Printsreen wie die selben Dokumente verteilt sind!
Sie unterscheiden sich nur mit den letzten hinteren Zahlen!
Einen Ordner Intelligente Gruppe habe ich angelegt!

Schon mal Danke
Bildschirmfoto 2019-02-11 um 09.47.28.png


#4

Der Name ist wie gesagt eigentlich irrelevant bei der Duplikaterkennung. Sind denn Dateigröße und Wortanzahl ebenfalls identisch?


#5

Ok, also eine Wort oder ein Buchstabe schon kein Duplikat mehr!
Ist ja eigentlich auch logisch :open_mouth:
Gibt es noch eine andere Möglichkeit ähnliche Dokumente zu finden?
Danke


#6

Semi-automatisch nur per AppleScript, u.a. per Skripte > Daten > Ähnliche Inhalte finden & entfernen… Dieses Skript sucht für jedes der ausgewählten Dokumente nach ähnlichen Inhalten und falls welche gefunden werden, können diese auf Wunsch gelöscht werden.