Probleme mit einzelnen PDF nach OCR

Moin zusammen

Nachdem ich einen neuen Laserdrucker bekommen habe kann ich manche PDF aus der Devonthink Datenbank nicht mehr drucken. Da ich nach der Installation des Druckers ausgerechnet eines dieser PDF´s zum testen probiert habe, hab ich den Fehler natürlich beim Drucker gesucht und auch den Hersteller (Brother) mit ins Boot geholt. Der Druck wird angestoßen und laut Display des Druckers direkt wieder abgebrochen. Wie gesagt, nur bei einzelnen PDF´s. Wenn diese aus mehreren Seiten bestehen, können auch einzelne Seiten gedruckt werden, aber nie alle. Andere PDF´s können ganz normal ausgedruckt werden.

Nach mehreren Telefonaten mit dem Hersteller hat sich dann herausgestellt das die OCR Erkennung von Devonthink daran beteiligt ist. Beispiel: Habe eine PDF-Rechnung von unserem Fahrradhändler als e-mail Anhang bekommen. Diese kann ich ohne Probleme drucken. Wenn ich diese in DT importiere kann ich sie ebenfalls drucken, allerdings nicht mehr wenn ich auf dieses PDF OCR angewendet habe.

Mit dem alten Drucker (Epson Workforce) läßt sie sich jedoch drucken.

Das Problem liegt vermutlich auch mit am Druckertreiber, aber vermutlich doch auch irgendwie an der OCR Engine von DT.

Kennt wer dieses Problem, oder hat wer einen Tipp für mich?

Es scheint übrigen egal zu sein, ob es sich um eine selbst gescannte Datei oder um ein PDF welches als Mail Anhang gekommen ist, handelt.

Nebenbei, ich kann in den OCR Einstellungen nicht die Auflösung ändern, sie springt immer wieder auf Automatisch.

Danke und Gruß

Rainer

Devonthink Pro V4.1 auf MacMini M2 mit MacOS 15.7

Lassen sich diese Dokumente über die Vorschau.app drucken?

Druck über die Vorschau App ist auch nicht möglich. Habe das PDF dann auf ein MacBook ohne DT kopiert, auch da ist kein Ausdruck möglich. Von Windows aus allerdings kein Problem, wieso ich ja auch den Druckertreiber mit in Verdacht habe.

Aber irgendwas muss DT beim OCR ja machen das ich diese Datei mit diesem Drucker nicht mehr drucken kann. Ein alter Brother Laserdrucker wiederum druckt auch unter MacOS.

Gruß

Rainer

Die von der Abbyy FineReader-Engine beim OCR erstellten PDF-Dokumente entsprechen eigentlich der PDF-Spezifikation, d.h. das klingt doch eher nach einem Problem des Druckertreibers. Insbesondere da es in den letzten 20 Jahren nie ähnliche Berichte gab.

Gibt es denn eine Möglichkeit das OCR Rückgängig zu machen :face_with_raised_eyebrow: ?

Was ist mit der Voreinstellung der PDF-Auflösung in Einstellungen > OCR die immer auf “Wie Original” steht? Die sollte man doch bestimmt ändern können?

Muss mir da mal irgendwas überlegen wie ich damit umgehe, zum Glück braucht man diese Dateien ja meist nicht mehr drucken.

Besten Dank schon mal für die Unterstützung

Gruß

Rainer

Höchstens mit externen Tools. Eventuell hilft es aber schon, die PDF-Dokumente in ein neues PDF-Dokument zu drucken oder mit Hilfe der Vorschau.app als neues PDF zu exportieren.

Die nächste Version wird diesen Fehler der deutschen Lokalisierung korrigieren.

Hatte noch ein wenig probiert und siehe da - wenn ich in DT das PDF konvertiere in PDF/A läßt es sich auch mit dem neuen Drucker ausdrucken :grinning_face:

Damit komme ich klar.

Danke für die Unterstützung :+1:

1 Like

Hm. PDF/A bedeutet ua, dass alle Schriften ins Dokument eingebettet sind. Denkbar wäre (mit viel Fantasie allerdings), dass das unsichtbare Textlayer mit einer Schrift angelegt wird, die dein Drucker nicht hat. Dann kann er das PDF natürlich nicht drucken.

Im PDF/A wäre diese Schrift aber eingebettet, sodass es sich drucken ließe.

Acrobat Reader kann in den Dokumenteigenschaften die verwendeten Schriften anzeigen:

Es wäre also vielleicht interessant, mal zu gucken, was er beim Original-PDF (mit OCR) und bei der PDF/A-Variante zeigt.

Wobei eine unsichtbare Text-Layer eigentlich auch nicht gedruckt werden sollte.

Irgendwo im PDF steht halt sinngemäß findfont (so heißt das zumindest in PostScript). Dass der nur zum Drucken von weißer Schrift auf weißem Hintergrund benutzt wird, ist in dem Moment nicht klar. Wäre ich ein PostScript-Interpreter, würde ich da aussteigen, weil es vermutlich keinen Sinn hat, weiterzumachen. Selbst wenn da 100 Seiten weiß auf weiß kommen – wer sagt, dass nicht auf Seite 101 ein einzelner Punkt in dieser Schrift schwarz erscheinen soll?

Das mit dem fehlenden Font ist aber ohnehin nur Stochern im Nebel. Schließlich scheint Vorschau ja kein Problem mit der Anzeige zu haben – könnte also tatsächlich eine Macke des Brother Druckers sein.

Wenn ich über Windows drucke funktioniert es aber :thinking:

Treiber… Keine Ahnung. Hast Du mal im Netz nach ähnlichen Schwierigkeiten mit diesem Drucker gesucht?

Habe heute nach nochmaliger Suche tatsächlich was aus einem Linux-Forum gefunden.

Gleicher Drucker, konnte auch einzelne PDF´s nicht drucken. Die haben es da auf unterschiedliche Seitengrößen geschoben, wurde aber wohl nie tatsächlich gelöst.

Bei Brother ist das Problem angeblich nicht bekannt, man hat mir nur geraten die Dateien in einem anderen Format zu drucken. Wie das funktionieren soll haben sie mir allerdings noch nicht gesagt.

Da ich ja wohl anscheinend drucken kann wenn ich die Dateien in PDF/A umgewandelt habe, ist die Sache für mich erst einmal abgehakt.

Werde demnächst mal die Scannersoftware das OCR überlassen und mal schauen was dann passiert.

Danke und Gruß

Rainer

Ich kann bei meinem Drucker zwischen AirPrint und PostScript wählen. Gibts da bei deinem Drucker auch unterschiedliche Treiber? Was da genau der Unterschied ist weiß ich nicht, ausser dass ich bei PostScript mehr und detailliertere Einstellmöglichkeiten habe.

Habe glaube ich alle Varianten durch, alle mit dem bekannten Ergebnis :man_shrugging: