Doppelte Dokumente im Eingang

Hallo,
Ich beschäftigte mich schon seit einiger Zeit mit der Einrichtung von DTP und hänge an einem Problem, für das ich leider noch keine Lösung gefunden haben.
Und zwar werden bei mir die Dokumente im globalen Eingang nach der OCR Texterkennung scheinbar verdoppelt, das bedeutet ich habe dann immer zweimal das selbe Dokument mit der Art PDF+Text im Eingang liegen.
Interessanterweise haben beide Dokumente eine leicht unterschiedliche Dateigröße, sind aber inhaltlich identisch.
Ich habe versucht das Problem mit einer intelligenten Regel zu lösen, aber ich bekomme keine Duplikate angezeigt.
Das Problem tritt unabhängig vom Import auf, also egal ob ich die Dokumente über ScanSnap oder Drag & Drop in den Eingang verschiebe.
In den Einstellungen habe ich die Funktion Originaldokument in den Papierkorb legen aktiviert.

Ist die Option Originaldokument: In den Papierkorb legen unter Einstellungen > OCR aktiviert?

(Letzter Satz des OP)

Danke für den Hinweis! Dann stellt sich die Frage, wann genau es zu den Duplikaten kommt. Ist evtl. die Option Einstellungen > Sync > Konflikte > Dokumente duplizieren auf irgendeinem Gerät aktiv?

Bei mir taucht seit heute ein ähnliches Problem auf. Zunächst sandte Scansnap Manager (V. 7.1 L26) die Scans nicht mehr direkt in die Inbox von DT3 (3.6.2), sondern in den Ordner Pictures. Das liess sich einfach beheben.

Nun gelangen aber sämtliche Scans doppelt in die Inbox. Und obwohl in den Einstellungen vermerkt ist, dass eintreffende Scans in durchsuchbare PDF umgewandelt und die Originale in den Papierkorb gelegt werden, geschieht weder das eine noch das andere.

In allen Geräten (MacOS 11.2.1, iOS 14.3 mit DTG 3.0.1) ist bei Sync>Konflikte<Neueste ausgewählt.

Wie kann ich bewirken, dass die Scans nur einmal eintreffen und automatisch ein OCR durchgeführt wird?

Werden die Scans direkt an DEVONthink geschickt? Oder eventuell den Ordner ~/Library/Application Support/DEVONthink 3/Inbox, was bei Scans & Downloads nicht empfohlen ist?

Ja, genau das habe ich nun eingestellt: Ordner ~/Library/Application Support/DEVONthink 3/Inbox. Aber mit ~/Pictures hatte es eben nicht mehr funktioniert: Da blieben die Scans im Ordner Pictures hängen.

Die Scans sollten definitiv direkt an DEVONthink (an die App!) geschickt werden, so dass DEVONthink erkennen kann, dass sie von einer Scanner-Software stammen.

Dies müsste ich ja im Scansnap Manager als “Speicherort für Bilddaten” eingeben. Wenn ich dort den Ordner “Programme” aufrufe, erscheint Devonthink 3.app in grau und kann nicht angeklickt werden…

Jetzt habe ich die Option gefunden, sorry! Doch Devonthink 3 war tatsächlich ausgewählt. Bloss als Bilddatenbank hatte ich dann ~/pictures eingegeben. Ich versuche es nochmals mit einem Neustart und melde mich, wenn es nicht klappt.

Und siehe da: Es funktioniert! Herzlichen Dank für die immer so rasche Hilfe!

Vielen Dank für den Tipp. Ich habe auf meinem Mac sowie auf meinem Iphone die Einstellung “Dokumente duplizieren” deaktiviert.
Leider konnte ich dadurch das Problem nicht beheben.
Sobald ich ein neues PDF in meinen Eingang importiere startet automatisch die OCR Texterkennung. Nach Abschluss wird dann ein neues Dokument erzeugt und ich habe zweimal das selbe Dokument im Eingang liegen.
Das Problem tritt auch nur auf meinem Mac auf, auf meinem Iphone funktioniert alles.

Wie genau wird denn das PDF in den Eingang importiert?

Magst du (gerne nachdem du Criss Frage vor meinem Post beantwortet hast) vielleicht versuchsweise diese Option ausschalten, DT3 neu starten und die Option wieder anwählen? Ich befürchte zwar es hilft nichts, weil du beschreibst, dass beide Dokumentkopien mit PDF+Text gekennzeichnet sind, aber der Versuch tut nicht weh. Vor geraumer Zeit hatte ich eine Option die nach einem Update nicht mehr wusste, dass sie angewählt ist; ich kann mich nicht mehr genauer erinnern, weiß aber, dass es wie beschrieben zu lösen war.

Zum größten Teil via ScanSnap iX1600 (Scan to Devonthink) oder Drag&Drop. Was ich etwas seltsam finde ist, dass die beiden Dokumente eine unterschiedliche Größe haben.

Vielen Dank für den Tipp, hat aber leider nicht funktioniert :upside_down_face:

Wie kommt das unterschiedliche Änderungsdatum zustande? Und ganz konkret bei dem aufgeführten Dokument: das ist per Drag&Drop in die Inbox gekommen nehme ich an (ich sehe eine URL; dann erklärt sich auch das unterschiedliche Datum); war es nicht bereits im Original ein PDF mit Textlayer? Wenn ja, durch welchen Mechanismus ist es dann nochmal durch OCR gegangen?

Diejenigen Dokumente die per Drag&Drop in die Inbox kommen (und nicht vom Scanner) durchlaufen in der Grundkonfiguration von DT kein OCR; du hast also eine Regel oder Skript? Kannst du das hier posten?

Gibt es evtl. eine intelligente Regel, die OCR ebenfalls durchführt?

Ich glaube, das könnte die Lösung sein. Es gab tatsächlich eine intelligente Regel für OCR… Ich habe sie jetzt einmal deaktiviert und.nun scheint alles zu klappen!