Habe gerade folgendes Problem:
In meiner Datenbank befinden sich Dokumente, die über einen längeren Zeitraum hinzugefügt wurden. Einige der älteren Dokumente sind PDFs ohne OCR. Nun möchte ich diese PDFs nachträglich einem OCR-Lauf unterziehen.
Dabei habe ich festgestellt, dass es keine Funktion gibt, mit deren Hilfe einfach alle noch nicht OCR-gescannten Dokumente einem OCR-Lauf unterzogen werden können. (Oder ich habe sie noch nicht gefunden! )
Dies wäre Feature-Wunsch Nr.1!
Ich muss hier über eine intelligente Gruppe alle PDFs anzeigen und die Ergebnisliste danach nach der “ART”-Spalte sortieren, um alle noch nicht konvertierten PDFs in der Datenbank zu finden. (Ziemlich umständlich! )
Aber viel wichtiger:
Nach dem OCR-Lauf werden gemäß meinen “Einstellungen” die alten PDFs in den Papierkorb gelegt. Die neuen sind aber alle als ungelesen markiert. Das ist natürlich Quatsch, da ich einfach nur meine alten Dokumente durchsuchbar machen will. Gelesen habe ich sie ja bereits mitunter vor Wochen. Sie sind mir also bekannt und damit nicht neu. Gerade in einem Team, bei dem die Datenbanken beispielsweise über einen SyncStore synchronisiert werden, führt das mitunter zu großen Irritationen.
Also wäre es wichtig, wenn man bei der OCR Konvertierung festlegen kann, ob die neu erzeugten Dokumente als gelesen, ungelesen oder mit dem gleichen Status des Ursprungsdokuments versehen werden sollen. Bedeutet: Konvertiere ich ein gelesenes Dokument, so soll das Konvertierte ebenfalls gelesen sein und umgekehrt analog bei ungelesenen Dokumenten.
Dies wäre Feature-Wunsch Nr. 2.