OCR braucht mehr als 60GB Plattenplatz

Hallo,

ich verwende DevonThink Pro Office 2.7.7 und muss einige Bücher über OCR durchsuchbar machen.
Bei einem Buch mit 700 Seiten hat nun das OSX die Meldung “zu wenig Plattenplatz auf der Systemplatte” gemeldet und wirklich von den 60GB freiem Plattenplatz waren nur noch 700MB frei. Nach dem Abbruch des OCR waren die 60GB natürlich wieder da !

Weiter Infos:
iMac 2010 i5 3,6GHz mit 16GB RAM, 500GB SSD
OCR in Devonthink steht auf Auflösung 150ppi, Qualität 75%

Wo liegt das Problem ? Wieso braucht der Prozess soviel Speicher ?
Wird hier nicht Seite für Seite verarbeitet ?

Info:
Seite 240 und 20GB sind weg !

ich hab den Speicherverbrauch weiter beobachtet, man muss nur über den ersten Durchgang kommen, dann erfolgt das “Erkenne Seiten” dann wird der Speicher wieder Seite für Seite frei gegeben - So genau hab ich vorher nie beobachtet.

Nur was mache ich jetzt, das war ein 59,2MB PDF die nächsten haben 74,5 und 87,5MB !

Kann man den Speicher auslagern, oder wo entstehen das/die “Temp-File(s)” ???

Könnten Sie uns evtl. eine Kopie des Dokuments schicken, z.B. per Dropbox? Ansonsten wäre eine Möglichkeit eventuell, das Dokument in mehrere aufzuteilen, OCR auszuführen und danach das Ergebnis wieder zu vereinen.

Hallo,

das Problem ist bei jedem größeren PDF. OCR braucht beim ersten Durchlauf (Erkenne Seite) Seite für Seite immer mehr Speicher - damit läuft die Platte zu und beim zweiten Durchlauf (Texterkennung) wird Seite für Seite der Speicher wieder freigegeben.

Entweder stellt man im OCR um, das Seite für Seite beide Durchläufe durchgeführt werden, dann würde OCR eine feste Plattenplatzmenge verbrauchen, oder man kann die Platte wählen auf der das ganze Abgelegt wird, damit einem nicht die Systemplatte voll läuft.