Postbank-Kontoauszüge seit Anfang 2023 mit seltsamem OCR-Format

Hallo,

Beim Erstellen von Hazel-Regeln zum automatischen Verschieben von PDF’s ist mir aufgefallen, daß die Kontoauszüge, die ich von der Postbank-Seite seit Anfang 2023 herunterlade, von ihrem OCR-Inhalt nicht erkannt werden. Wenn ich innerhalb von DT den OCR-Vorgang neu anstoße, funktioniert es einwandfrei. Bei den Kontoauszügen vor 2023 gab es da nie Probleme.

Ich habe mir einmal die Informationen zu einzelnen Dateien näher angesehen und bei den Eigenschaften folgende Unterschiede ausgemacht :
- Bei alten Kontoauszügen bis Ende 2022 steht als Produzent
StreamServe Communication
Server 5.6.2 GA Build 1210 (64 bit)
- Wenn ich OCR für die Datei innerhalb von DT neu angestoßen habe, steht als Produzent “ABBYY FineReader Engine 12”
- Bei den neuen Kontoauszügen seit Anfang 2023 steht dann dort “XEP 4.28.759”
Wenn ich in einer solchen Datei Text markiere und kopiere, dann sehe ich, daß beispielsweise Zahlen zu Text werden.
Aus “DE16 5001 0060” wird dann “abNS RMMN MMSM”.

In Hazel könnte ich ja noch diese “falschen” Texte in der Regel angeben, damit die Datei in den richtigen Ordner verschoben wird, aber wie kann ich dann DT dazu bringen, die Datei neu zu OCRen?

LG Bernd

Wenn Hazel die falschen Dateien erkennt, könntest Du es ja ein dies anzeigendes Tag setzen lassen. Und dann eine Smart Rule in DEVONthink, die bei diesem Tag aktiv wird, die OCR startet und das Tag anschließend wieder entfernt.

Und ist Hazel überhaupt noch nötig? Könnte DT nicht alles übernehmen?