OCR dauert bei manchen PDFs verdammt lange - woran liegts?


#1

Hallo zusammen,

als langjähriger DTPO-Nutzer ist mit heute aufgefallen, dass OCR aktuell bei manchen PDF-Dokumenten extrem langsam läuft.
Langsam bedeutet, mehrere Minuten für zwei Seiten PDF (Scan aus Fachbuch). Auch abbrechen kann man dies nicht so einfach, das Aktivitätenfenster hängt bei “Breche ab…”

Gibts da Erkenntnisse, woran dies liegen kann?

Grüße
Andreas


#2

Welche Auflösung & Qualität ist in Einstellungen > OCR eingestellt? Ist die Anzahl der Seiten jeweils identisch?


#3
  • Auflösung ist eingestellt: 150ppi oder Selbe wie Scan
  • Qualität ist auf 75% eingestellt
  • Die Anzahl der Seiten ist unterschiedlich, aber durchgehend recht gering, daran sollte es nicht liegen

Es sieht ganz so aus als stammen diese “Problem-PDFs” alle nicht von meinem ScanSnap sondern noch von einem Scanner in der Uni. Die Dateigröße liegt zwar bei 2-5MB, die Größe allerdings bei 87cm x 132cm - hier liegt wohl das Problem. Wer das auch immer gescannt hat…
Auf A4 verkleinert abgespeichert gibts keine Probleme wie es aussieht.


#4

Seien Sie vorsichtig bei der Verwendung von “Same as Scan”, da Scans manchmal mit zu hoher Auflösung durchgeführt werden. Ich schlage vor, dass Sie diese Einstellung nur verwenden, wenn Sie den Scan selbst durchgeführt haben (und wir empfehlen 200dpi, maximal 300).