ich habe mit relativ vielen wissenschaftlichen und halb-wissenschaftlichen papers zu tun, die ich i.d.R. als pdf bekomme. Ich benutze kein Bibliothek-Programm wie z.B. zotero, möchte aber bei allen in Devonthink gespeicherten Dokumenten den Namen der Autorin, den Titel, sowie Erscheinungsort und -datum in den Metadaten speichern. Mit DT4 sollte es für eine KI ja ein Leichtes sein, diese angaben zu extrahieren. Aber ich bin nicht in der Lage, hierfür ein Skript zu schreiben. Könnte mir jemand ggf. helfen?
Ganz herzlichen Dank und viele Grüße in die Runde von Ben
Ja, das wäre schön. Aber oft genug bekommt man pdfs, in denen insbesondere Autorennamen, Titel usw. nicht in den Metadaten aufgeführt sind – wie in Deinem Beispiel ja auch. Ich suche nach einem Skript, das genau diese Daten aus dem Text extrahiert und dann in den pdf-Metadaten einträgt. Ich kann das auch per Hand machen – aber das kommt mir im Jahr 2025 etwas altmodisch vor.
Wenn man klare Regeln angeben kann, die solche Daten identifizieren – dann lässt sich das per Script erledigen. Allerdings glaube ich nicht, dass es solche Regeln gibt.
Die nächst beste Variante könnte der DOI sein.
Und “natürlich” AI. Da muss man nur den passenden Prompt schreiben.
Mein Screenshot stammte von einer Bankabrechnung. Deshalb keine Metadaten. Dass wissenschaftliche Artikel 2025 ohne solche Daten kommen, finde ich merkwürdig.
„Altmodisch“ ist nicht gleichbedeutend mit minderwertig. Und KI wirft auch Fragen zum Datenschutz und zur Zweckmäßigkeit von Funktionen auf. Einige Aufgaben könnten von KI übernommen werden, aber es gibt viele Aufgaben, die Sie manuell effizienter und genauer selbst erledigen können. „Altmodisch, aber genau“ ist besser als „neu und ungenau oder fragwürdig“.
Allerdings lässt sich dies bereits mit dem Skript „Skript anwenden > Extern > Bibliografische Metadaten herunterladen“ erreichen.
Das sieht interessant aus. Es stimmt natürlich, dass in vielen Fällen die bibliographischen Metadaten irgendwo hinterlegt sind, aber in der Hektik lade ich sie oft nicht mit herunter. Wenn man auf einschlägigen Portalen (jstor.com, academia.edu, researchgate.net usw.) die Texte als pdf lädt, hat man in der Regel nicht die biblographischen Metadaten automatisch dabei. Man muss sie getrennt laden und z.B. in zotero, endnote o.ä. speichern – Programme, die ich nicht benutze, weil ich nicht streng wissenschaftlich arbeite. (Ich brauche die wiss. Texte i.d.R. zum Verfassen von Radio-Beiträgen.) Ich werde das Skript “Download Bibliographie Metadata” ausprobieren – sieht so aus, als wäre das genau die Lösung, die ich brauche. Danke!
Sorry for the English( and badly auto-translated German) but I just tried this script on a PDF I downloaded that was about a food I am interested in and I have to say it was another one of those Devonthink feeling almost magical kind of situations. I know that this is the rusult of a mix of online standards for metadata storage, academic articles being somewhat similar in format across many disciplines, and the clever folks at Devonthink, but because I don’t work in academia or need bibliographic information on PDFs I download, I found the result very cool.
I can’t help but read this back and think that whatever translation thing I am using is not going to do me any favours
________________
Entschuldigen Sie bitte mein Englisch (und die schlechte automatische Übersetzung ins Deutsche), aber ich habe dieses Skript gerade an einer PDF-Datei ausprobiert, die ich heruntergeladen habe und die sich mit einem Lebensmittel befasst, das mich interessiert, und ich muss sagen, dass es wieder einmal eine dieser fast magisch anmutenden Situationen war, wie man sie von Devonthink kennt. Ich weiß, dass dies das Ergebnis einer Mischung aus Online-Standards für die Speicherung von Metadaten, akademischen Artikeln, die in vielen Disziplinen ein ähnliches Format haben, und den cleveren Leuten bei Devonthink ist, aber da ich nicht in der Wissenschaft arbeite und keine bibliografischen Informationen zu den PDFs benötige, die ich herunterlade, fand ich das Ergebnis sehr cool.
Ich kann nicht anders, als das noch einmal zu lesen und zu denken, dass mir die Übersetzung, die ich verwende, keinen Gefallen tut.