DEVONthink: Nutzung von Barcodes

GernotG · April 22, 2024, 8:42pm

Hallo!

Ich möchte meinen Umgang mit zu scannendem Papier verbessern und wurde auf die Möglichkeit aufmerksam, mittels aufgeklebten Barcodes auf zu scannenden Dokumenten eine bessere Zuordnungen der Scans zu den resultierenden Dateien zu bekommen.

Gerne würde ich noch mehr Nutzen aus den Barcodes ziehen. Soweit ich sehe, ist es mit DT möglich, den Barcode auszulesen und in einem benutzerdefinierten Datenfeld zu speichern. Dies habe ich allerdings noch nicht erfolgreich hinbekommen. Ich merke, dass mir das Verständnis fehlt, wie die Funktion gemeint ist bzw. wie ich Daten abspeichere. Ich habe das Feld “Strichcode” aktiviert. Mir ist unklar, welchen Typ ich auswähle sollte. Ich nehme an, dass es sinnvoll wäre, “einzeiligen Text” oder “mehrzeiligen Text” auszuwählen, da das dem Schema der gewählten Barcodes entspricht. Allerdings habe ich es bis jetzt noch nicht hinbekommen, einen Barcode auszulesen und Text in das Feld abzuspeichern. Wie gehe ich da vor?

cgrunenberg · April 23, 2024, 5:51am

Der empfohlene und voreingestellte Typ ist Identifikation. Zunächst müssen die Bilder oder PDF-Dokumente allerdings auf Barcodes gescannt werden, entweder manuell per Daten > Tags > Strichcodes scannen, per Voreinstellung (Einstellungen > Dateien > Import > Erkennung > Strichcodes scannen) oder mit Hilfe intelligenter Regeln (s. Aktion Tags > Strichcodes scannen)

GernotG · April 23, 2024, 6:21am

Danke @cgrunenberg !
Ich habe auf “Identifikation” zurückgestellt und DT neu gestartet.

Ich habe manuell auf Barcodes gescannt mit Daten > Tags > Strichcodes scannen bei meinem ausgewählten Test-Dokument. Ich kann nicht erkennen, das sich irgendwas geändert hat. Auch im Fenster Aktivität regt sich nichts, nachdem ich die Strichcodes scannen lasse.

Muss der Typ des Barcodes (UPC, EAN, etc.) irgendwo ausgewählt werden, bzw. gibt es Barcodes, die aus bestimmten Gründen nicht funktionieren?

cgrunenberg · April 23, 2024, 7:00am

Es werden nicht alle Barcodes erkannt/unterstützt von macOS. Um was für ein Dokument handelt es sich denn, Bild oder PDF-Dokument? Und falls PDF-Dokument - auf welcher Seite ist der Barcode?

GernotG · April 23, 2024, 3:20pm

Es geht um PDF-Dokumente. Die Barcodes werden vornehmlich auf Seite 1 eines jeweiligen, mehrseitigen Dokumentes sein.

Danke für den Hinweis zur Voraussetzung, dass macOS hier bedient werden muss. Welche Barcodes sind möglich?

Ich habe bisher mit “Code 128” getestet, was meinen Scan-Workflow mit einem Fujitsu-Scanner und der Scan-Software “ExactScan Pro” betrifft. Was das betrifft, funktioniert das so im Augenblick, wie ich es mir vorstelle: Die Software separiert die Dateien anhand der auf den Dokumenten angebrachten Barcodes.

Ist “Code 128” auch für macOS verwendbar?

GernotG · April 23, 2024, 6:37pm

Ich habe noch etwas herumprobiert und gemerkt, wo mein Fehler lag:

Der Barcode war zu klein gedruckt, deshalb wurde beim Scan nichts erkannt. Mit einem größeren Druck (bzw. in meinem Test-Fall "Save PDF to Devonthink) wurde das Datenfeld korrekt befüllt.

Die bisherige Größe wurde gewählt, weil Sie zu vorhandenen Selbstklebe-Etiketten passt. Diese Etiketten sind von Herma, Produkt-Nr. 10916, 25,4mm x 16,9mm. Ich schaue mich nun nach größeren Etiketten um.

BLUEFROG · April 23, 2024, 6:56pm

Und ein Code 128-Barcode wurde korrekt erkannt und zu den benutzerdefinierten Metadaten hinzugefügt?
Wenn ja, werde ich dies in der Dokumentation vermerken.

(Übersetzt mit DeepL)

GernotG · April 23, 2024, 7:11pm

Hallo Bluefrog,

ja, das ist richtig.

Ich habe den Barcode jetzt mal physisch ausgedruckt und eingescannt. Wenn ich diese Datei in Devonthink importiere, dann OCR durchführe, wird das Datenfeld “Strichcode” korrekt befüllt. Ich hänge meine Test-Datei an.
EXACTSCAN 2024-04-23 21:04 -2.pdf (184.8 KB)

BLUEFROG · April 23, 2024, 7:13pm

Vielen Dank für das Dokument und die Klarstellung!

cgrunenberg · April 24, 2024, 6:09am

S. VNBarcodeSymbology | Apple Developer Documentation

cgrunenberg · April 24, 2024, 8:25am

Danke für die Datei! Mit der nächsten Version klappt es auch ohne OCR.

mr_drlove · April 30, 2024, 12:08pm

@GernotG, ich habe leider kaum Ahnung von Barcodes. Allerdings hört sich das sehr interessant an, was Du machst. Kannst Du mal kurz deinen ganzen Workflow vorstellen. Damit ich eine Vorstellung bekomme, was Du genau tust und worin der Mehrwert für dich besteht. Das wäre sehr hilfreich.

Vielen Dank.
ciao
mr_drlove

GernotG · April 30, 2024, 2:48pm

Hallo @mr_drlove ,

gerne erläutere ich meinen Ansatz.

Ausgangslage
Ich nutze DEVONthink schon seit Jahren mitunter für das Einscannen und Ablegen von Papierpost. Es geht hauptsächlich um Belege im Kontext von Ausgaben für Immobilien. Als Hardware benutze ich den Fujitsu ScanSnap 1500x mit der ScanSnap-Software. Die resultierenden Dateien lege ich manuell in einer Datenbankstruktur / Ordnerstruktur ab. Die Papiere, die ich aufbewahren will / muss, werden von mir in einer physischen Ordnerstruktur abgelegt. Ich bin kein sehr versierter DEVONthink-Nutzer, beispielsweise nutze ich keine “intelligenten Regeln” oder “intelligente Gruppen”. Die Hauptfunktionen sind für mich Ablage, Texterkennung und Suche (z.B. Belegnummern, bezahlte Beträge, etc.)

Problemstellung
Zunächst stellte ich fest, dass mir die physische Ablage bzw. mein System dazu mir zunehmend auf den Nerv geht. Ich scanne Belege, die ich vorab manuell trenne bzw. einzeln einscanne, um einzelne Dateien zu erhalten. Die physisch zu archivierenden Papiere lege ich in der physischen Ordnerstruktur ab, das betrifft mehrere Ordner und viel hin-und-her-geblättere in den Ordnern, um an einzelne Abschnitte zu kommen, die für die Ablage relevant sind.

Absicht
Ich will mein Papier-Abfertigung beschleunigen. Ziel ist, weniger Zeit mit dem Scannen und Ablegen zu verbringen, aber den Bezug zwischen Datei und physischem Ablageort des Papiers nicht zu verlieren.

Ansatz
Ich kann das Scannen beschleunigen, wenn ich nicht jedes Dokument einzeln scannen muss, sondern einen ganzen Stapel auf einen Schlag einscanne. Ich bin auf die Scan-Software “EXACTscan” aufmerksam geworden. Diese kann anhand von Barcodes Scans trennen, so dass ein Stapel Papier, dessen Dokumente mit Barcodes gekennzeichnet sind, einzelne Dateien ergibt.

Ich vereinfache meine physische Ablage. Ein Ordner für ein Kalenderjahr, ohne Zwischenabschnitte. Alles, was gescannt wird, soll einfach obendrauf geheftet werden. Auf den Dokumenten klebt jeweils ein Barcode, der eine laufende Nr. im Klartext enthält. Dieser Klartext wird auch in DEVONthink am Dokument abgespeichert, und ich kann das physische Original anhand dieser Information im Fall, dass es nötig wird, heraussuchen.

Umsetzung
In EXACTscan gibt m.E. es eine kleinere Auswahl an nutzbaren Barcode-Systemen als in DEVONthink bzw. macOS. Ich habe mich für den Code128 entschieden, weil er in beiden Systemen benutzbar ist.

Ich stelle fest, dass ich den Code nicht zu klein drucken darf, da er sonst beim Einscannen nicht zuverlässig erkannt wird. Nach einigen Tests habe ich eine funktionierende Größe gefunden.

Je größer der Informationsgehalt ist, der codiert werden soll, desto länger wird der Code, und desto mehr Platz muss ihm gewährt werden, wenn er ausgedruckt wird. Gerne hätte ich einen 2D-Code benutzt (da dabei mehr Informationen auf kleinerer Fläche untergebracht werden können), aber EXACTscan bietet dazu nicht an, dass man damit die eingehenden Scans entsprechend in einzelne Dateien aufsplittern kann (bzw. nur über ein Upgrade auf eine Enterprise-Version, die für meine Zwecke zu teuer ist.).

Der Code128 funktioniert für meine Belange gut.

Bewertung
Im Zuge des Ausprobieren und Lernens bin ich auf Funktionen von DEVONthink aufmerksam geworden, die mir gut gefallen und die ich bisher nicht benutzt habe. Z.B. automatisches Umbenennen, basierend auf dem Inhalt von PDF´s. Ich habe mich damit ein paar Stunden beschäftigt und gemerkt, dass es noch nicht so reibungslos klappt, wie ich es gerne hätte.

Ich habe mich für das Zusammenspiel von DEVONthink und Hazel interessiert, aber davon erstmal Abstand genommen. So hoch ist mein Arbeitsaufkommen in dem Zusammenhang auch nicht, als dass es sich lohnen würde, alles durchzuautomatisieren. Aber ich finde die Möglichkeiten interessant und halte da die Augen offen.

Wunschvorstellung
Idealerweise würde ich alles in DEVONthink machen. Eine Extra-Software einzubinden (wie z.B. Hazel) finde ich tendenziell unattraktiv, weil mehr zu beachten ist und mehr Fehler entstehen können.

Es würde mir gut gefallen, wenn DEVONthink noch mehr / präziser / flexibler Inhalte aus PDF´s auslesen und weiterverarbeiten kann. Vielleicht geht es sogar jetzt schon und ich bin einfach nicht gut genug informiert darüber?

Ansonsten kann ich mir vorstellen, dass mit KI so etwas gut gemacht werden könnte. Bin gespannt, ob sich bei macOS dieses Jahr Neuigkeiten hinsichtlich integrierter KI ergeben und inwiefern das Entwickler nutzen können für ihre Programme.

chrillek · April 30, 2024, 2:58pm

DT kann eigentlich jeden Inhalt aus einem PDF mit Textlayer (vulgo OCR) auslesen. Zur Not mithilfe eines Scripts.

mr_drlove · April 30, 2024, 3:28pm

@GernotG , vielen Dank für die ausführliche Darlegung. Nun verstehe ich Deinen Ansatz.
Leider habe ich überwiegend Dokumente die ich von extern zur Verfügung gestellt bekomme, die leider keinen Barcode haben. Ich scanne die Sachen auch und lege diese in eine Kiste einfach chronologisch. Zusätzlich schreibe ich mit Bleistift eine Nummer drauf, die dann ein Label im DT ist. So kann ich einfach das Original zum PDF finden.

Ja, es bleibt spannend. Ab 2025 ist in Deutschland teilweise die XRechnung verpflichtend. Ich bin gespannt, ob es dazu eine Erweiterung geben wird in DT damit wir vielleicht den XML-Teil automatisch verschlagworten könnten.

Also nochmals vielen Dank, freut mich immer wieder so ein reger Austausch!

GernotG · April 30, 2024, 5:37pm

Danke @chrillek !

Ich glaube, dazu fehlen mir diverse Kenntnisse, und ich bin noch unklar darüber, wieviel Zeit ich einsetzen will, um mich dahingehend weiterzubilden. Ich verstehe leider nichts von Skripts, bin aber interessiert. Vielleicht nehme ich das jetzt zum Anlasse, einen Einstieg zu suchen.

Frage dazu: Wann würde ich in die “Not” kommen, ein AppleScript benutzen zu wollen / müssen? Wo sind die Grenzen von DEVONthink in dem Kontext?

BLUEFROG · April 30, 2024, 5:52pm

Die künstliche Intelligenz wurde bereits ausführlich außerhalb dieser Diskussion erörtert. Sie können in den Foren danach suchen.

chrillek · April 30, 2024, 7:26pm

AppleScript? Hoffentlich nie JavaScript ist mE die bessere Wahl. Andere hier sehen das anders. Scripten muss man, wenn die in DT vorgesehenen Möglichkeiten nicht ausreichen. Und ich lerne immer wieder, dass diese Möglichkeiten weiter reichen als ich gedacht hatte.

So allgemein lässt sich das nicht sagen. Bei einem konkreten zu lösenden Problem stellt sich heraus, ob DT es kann oder ein Script dafür braucht.

Zb kann DT durchaus im Text eines PDF nach regulären Ausdrücken suchen und Tags entsprechend setzen. Oder auch Metadaten.