OCR über DT - Dateien deutlich größer

Hallo,

nachdem ich mir einen neuen Dokumtentscanner zugelegt habe (Epson ES-580W), ist es mir nun möglich ohne weitere Scan Software direkt vom Scanner in den Inbox Ordner von DT zu scannen. Über eine intelligente Regel lasse ich nach dem Import noch OCR anwenden. Alles funktioniert bestens. Allerdings fiel mir auf, dass die PDF Dokumente um einiges größer sind, als wenn ich über die Epson Scan Software scanne, die bereits OCR beinhaltet.

Beispiel eines Testdokumentes:
OCR Umwandlung über DT Dateigröße = 128KB
OCR Umwandlung über die Epson Scan-App Dateigröße = 28KB

Die Scaneinstellungen sind identisch.

Wie lässt sich so etwas erklären?

VG

Machst du also doppelt OCR, einmal per Scanner und einmal per DT? Unabhängig davon ist das Thema “PDF wird durch OCR größer” zumindest im englischsprachigen Teil des Forums schon häufiger diskutiert worden. Vermutlich gibt es dazu nichts Neues zu sagen.

Danke, doch vermutlich bin ich falsch verstanden worden. Wenn ich OCR über die Scanner App laufen lassen, läuft OCR kein weiteres mal in DT über das PDF. Anders gesagt, OCR kommt generell nur einmal zum Einsatz. Nur über DT ist das anschließend durchsuchbare PDF deutlich größer als wenn ich OCR über die Scanner App laufen lasse.

Dass das PDF nach der OCR Anwendung größer ist als ein nicht durchsuchbares PDF ist mir bewusst.

Ich schau dennoch noch einmal im Forum.

Danke für die Frage!
Sie sollten nicht erwarten, dass die Ausgabe von zwei verschiedenen OCR-Engines oder -Anwendungen gleich ist. Selbst wenn die Auflösung dort gleich eingestellt ist, sind die zugrunde liegenden Einstellungen, die Sie nicht steuern können, wahrscheinlich unterschiedlich. Am häufigsten ist der Unterschied auf die Komprimierung zurückzuführen. Einige Engines verwenden eine sehr aggressive Komprimierung, was zu viel kleineren Dateigrößen führt, andere nicht.

(Übersetzt mit Translatium)

1 Like

OK @BLUEFROG, vielen Dank für das Feedback :+1:

Viele Grüße

Gern geschehen!
Bitte beachten Sie, dass Sie in DEVONthink unter Einstellungen > OCR die Komprimierung aktivieren und die Auflösung einstellen können. 200dpi ist für die meisten Anforderungen ausreichend.

Wow, die Komprimierung hat einiges gebracht :+1: . Hierüber wird die Dateigröße deutlich kleiner. Die Option war bei mir nicht aktiviert gewesen.

1 Like