OCR Probleme


ich wollte in DTPO mehrere PDFs per “Convert” mit OCR in PDF+Text umwandeln.
Es waren ca. 20 Dateien von jeweils 1-5MB Größe. Nach 2 Stunden waren gut 6 Dateien konvertiert und ich habe die weitere OCR-Erkennung unterbrochen.
Jetzt fehlen mir gut 20GB an Plattenplatz die nicht freigegeben wurden.

Wie kann der Speicherplatz wieder freigegeben werden?

Dann habe ich noch eine Frage!
Nach dem obigen Experiment habe ich erneut eine Datei von 4,5MB Größe (enthielt 5 eingescannte Seiten) per OCR bearbeitet. Das hat über eine Stunde gedauert (besonders lange hat er zum öffnen benötigt) und DTPO hat dafür ca. 15GB Plattenplatz benötigt. Insgesamt war das System während der Konvertierung sehr träge. Die 15GB hat DTPO auch wieder freigegeben.

Ist es normal das das so lange dauert und soviel Plattenplatz benötigt?

Im Activity Monitor tauchte der Prozess RDE auf der nicht ansprechbar war.

Was hat RDE mit DTPO zu tun?

Mein System ist ein MacMini 2GHz Core Duo mit 4GB Ram OSX 10.5.2.

grüße Stefan.

PS Ist es besser wenn ich solche Fragen auf Englisch stelle?

I will reply in English since my written German is terrible.

Yes, it is entirely possible that the OCR process takes up a lot of RAM and time to finish. It is an open problem and depending on the complexity of the pages to detect the characters on it can take a long time (although yours is quite exceptional).
During this process temporary files are being created that will be removed by the system over time or when you reboot.

The next maintenance release will allow an option to send the original file to the Trash and also the OCR engine (RDE) will be updated. This may help with your documents.