Ich habe eine Reihe von in Farbe gescannten Artikeln (200 dpi). Diese liegen als PDF vor und ich will sie durch die Texterkennung in DEVONthink Pro Office schicken.
In diesem Prozess wird die Bildqualität aber immer sichtbar schlechter und die Dateien trotzdem teilweise massiv größer. Ich habe jetzt diverse Einstellungen (Unter Einstellungen/OCR bei den Punkten Auflösung und Qualität) ausgetestet:
Originaldatei: 5,6 MB
Auflösung: Selbe wie Scan/Qualität 100: 60,2 MB
Auflösung: Selbe wie Scan/Qualität 20: 60,2 MB
Auflösung: 200/Qualität 100: 29,7 MB
Auflösung: 200/Qualität 80: 5,4 MB
Auflösung: 200/Qualität 50: 5,4 MB
Auflösung: 150/Qualität 50: 3,5 MB
Das kann doch irgendwie nicht im Sinne des Erfinders sein. Warum wird bei dem PDF nicht einfach nur der Text-Layer ergänzt. So wie es jetzt ist, habe ich zwar ein durchsuchbares PDF, aber Qualitätseinbußen beim Anzeigen, selbst wenn die Datei nach dem OCR-Prozess zehn mal so groß ist.