Fehler beim Importieren

Was habe ich nun schon wieder verstellt? Wenn ich PDF Dateien importiere bekomme die im Anhang ersichtliche Fehlermeldung. Habe mich durch sämtliche Menüs gehangelt aber sehe den Wald vor lauter Bäumen nicht. Screenshot at Mar 20 09-48-59

Nach meinem Verständnis heißt das einfach nur, dass die PDF keine Textschicht hat. Um eine zu erhalten müsstest du OCR durchführen.

Ob die PDF eine Textschicht hat könntest du prüfen (wenn es dir eh nicht klar ist) indem du die Datei in Preview öffnest und versuchst text zu markieren, zu kopieren und wo anders (z.B. im Suchfeld) einzufügen; evtl. reicht es auch, im Suchfeld einfach nach einem Begriff in der Datei zu suchen und zu schauen, ob dieser gefunden wird.

Falls das nicht die Lösung ist, deine PDF also eigentlich eine funktionierende Textschicht hat: kannst du bitte genauer aufführen, was du machst (also eine Schritt für Schritt Anleitung); so dürfte es dann einfacher sein, mit dir eine Lösung zu erarbeiten.

Das ist es ja. OCR wird beim Import ausgeführt

Hallo Blanc,

ich möchte dazu nur anmerken, dass es scheinbar ein generelles Problem ist, verbunden mit PDF-Dokumenten, die von Telekom oder verschiedenen Banken erzeugt werden. Vermutlich ein Versions-oder Berechtigungsproblem. Ich habe das schon einmal bei euch angemerkt. Meine Rechnung von der deutschen Telekom kann ich mit Adobe 9 öffnen und Texte markieren und in andere Programme einfügen. Es kann auch nach Text gesucht werden. Nur leider nicht in DT 3, hier erscheint die Meldung, wie auch von rerexx gepostet. Seltsamerweise kann in dem Adobe-Dokument der Text aktiviert werden, aber kopieren oder danach suchen führt zu keinem Erfolg.

Mit Preview/ Vorschau funktioniert die Textbehandlung nicht, Adobe kann da wohl etwas mehr.

Es wäre wünschenswert, wenn da mal eine Lösung gefunden würde.

Geht es um die ganz normale Rechnung der Telekom? Funktioniert hier einwandfrei - sowohl in Vorschau wie auch in DEVONthink. Ich habe auch nicht die oben beschriebene Protokollmeldung beim Import.

Die von der Telekom ausgegebenen PDFs sind PDF 1.4, m.W. erzeugt mit DocBridge. Die PDF-Rechnungen haben eigentlich bereits eine OCR-Ebene, wenn sie ausgegeben werden

Ja, die normale Rechnung der Telekom, funktioniert bei mir in DT so wie ich es beschrieben habe. Wenn es auf einer anderen Maschine funktioniert, liegt das nun womöglich am Betriebssystem und der Version der Vorschau. Mein alter Mac mini läuft noch unter MacOS 10.11.6. Die PDF funktionieren allerdings in Adobe Acrobat Pro 9.5.5 wie gewünscht.

Wenn es sowohl in Vorschau.app wie auch Devonthink nicht funktioniert, liegt es vermutlich am PDFkit-Unterbau von macOS. Apple hat da im Laufe der vergangenen OS-Updates einige Böcke geschossen. Hier laufen Catalina und Mojave, bei beiden kann ich das Problem nicht nachstellen

Acrobat greift auf einen anderen Unterbau zurück

Hey @Roland_N ich bin nur ein einfacher Nutzer wie du auch :slight_smile: (wegen “schon einmal bei euch angemerkt”; die Jungs und Mädels von DT erkennst du am zusätzlichen DT-Symbol auf dem Piktogramm) - aber dein Feedback könnte dem OP durchaus weiterhelfen. @rerexx evtl. könntest du tatsächlich ein bisschen ausholen und erläutern, was du genau machst (Schritt für Schritt), und ob du - außer der Fehlermeldung - danach mit dem Dokument Probleme hast (gibt es denn eine Textschicht nach dem OCR?). Handelt es sich um Dokumente der Art wie Roland aufgeführt hat? Haben die PDFs vor dem Importieren bereits eine Textschicht? Welches OS benutzt du?

Es kommt in der Tat nur in PDF vor die ich von Bestimmten Anbietern zur Verfügung gestellt bekomme. Ich habe aber in den nächsten Tagen keine Zeit mich intensiver damit zu befassen. Wenn es die allgemeine Situation da draußen wieder zulässt das ich öfter am Rechner sitze kann ich intensiver testen. Ich nutze die aktuelle Version von DT3 und das aktuelle Mac OS. Soviel kann ich im Moment beisteuern.

Bei aller Unzulänglichkeit des PDFkits ist die Frage, ob diese Unternehmen tatsächlich valide PDFs ausgeben. Das ist selbst bei großen Firmen nicht sichergestellt. O2 hatte beispielsweise katastrophale PDF-Rechnungen ausgegeben (mittlerweile geht‘s)

1 Like