OCR Resolution / OCR Auflösung

Hallo. In DEVONthink Pro Office 2.x konnte ich bei OCR-Texterkennung die Auflösung einstellen, mit der das Dokument in DT abgelegt wird. Das geht jetzt nicht mehr. Und ich bin irgendwie nicht zufrieden. Aus folgendem PDF …

… wird nach der OCR-Texterkennung das hier:

Und aus 700 kb werden 70 kb.

Wo kann ich die Qualität des neuen PDF höher einstellen.

Hier habe ich nichts gefunden:

PS: PDF komprimieren abwählen hat absolut keine Änderung gebracht.

Welche Version von macOS verwenden Sie? Falls es sich um Mojave handelt, sollte die nächste Version von DEVONthink dies verbessern.

Ich benutzte Catalina 10.15.1 (19B2106)

Danke, ich leite dies weiter.

Sollte eigentlich schon bekannt sein: degraded text after ocr.
Ich hoffe auf einen baldigen Fix, momentan muß ich umständlich mit PDFPen OCRen… Wäre toll, wenn ich endlich wieder der OCR-Engine von DT3/Abbyy trauen könnte.

Die neue Version 3.0.3 sollte das korrigieren.

2 Likes

Danke. Ich werde es mir anschauen.

Super, jetzt funktioniert es wieder. Vielen Dank für die schnelle Lösung:

vorher:

jetzt Version 3.0.3:

Hi Christian

Mit 3.0.3 sehen die Scans wieder besser aus. Aber… die Erkennungsrate ist immer noch gegenüber DT2 deutlich gesunken. Daher muss ich so manches PDF mit DT2 scannen. Ein echter Rückschritt. :slightly_frowning_face:

Z.B. wird die Sendungsverfolgungsnummer von einer Postquittung RD793786405 mit DT3 fälschlich als R0793786405 erkannt während DT2 kein Problem damit hat.

Dateigrößen

Orginalgröße des PDF:  104 KB
Nach OCR in DT2:       116 KB
Nach OCR in DT3:        79 KB

OCR Einstellungen in DT2

Resolution: Same as scan
Quality:    75%

Es wäre sehr gut, wenn ihr das wieder auf den alten Stand bringen könntet.

Wir leiten das an Abbyy weiter, auf die eigentliche OCR-Engine haben wir keinen Einfluss. Ein Beispieldokument, bei dem das Problem auftritt, plus ein Bildschirmfoto der OCR-Einstellungen wäre natürlich super. Danke!