Hallo,
ich besitze einen ScanSnap und Scanne ziemlich viele Dokumente um das Papier los zu werden. Da die Ansteuerung des Scannen ziemlich bescheidnen, oder kaum möglich ist, habe ich einen ganz anderen Workflow entwickelt.
Ich habe auf dem Schreibtisch einen Ordner mit dem Namen “Einsortieren” und das Icon von DEVONthink dort einkopiert. Ich Scanne mit dem ScapScan ohne OCR-Texterkennung direkt in diesen Ordner. Der Ordner hat eine Ordneroption mit der dann die Dokumente mit OCR erkannt werden und in den Globale Eingangskorb der DEVONthink Datenbank verschoben wird.
Das ganze hat jetzt vier große Haken.
- Der Dateiname lautet: 2012_01_12_17_04_32.pdf
- Es sind keine Tags enthalten
- Es ist keine Struktur definiert
- In den Globalen Eingang der Datenbank
Das bedeutet der Name ist nichts sagend, wenn das Datum nicht gerade das Papierdatum ist, was sehr sehr unwahrscheinlich ist.
Die Tag Vergabe in DEVONthink ist zwar machbar, aber die Datei verschiebt sich nicht automatisch an den richtigen Ort.
Die Struktur muss von Hand gebaut werden um die Datei dort hin zu verschieben.
Aus diesem Grund habe ich 2 Jahre an der Tag Maschine geschrieben und die ist auch soweit fast fertig. Die Plazierung dieses Tools würde ich gerne in das Skript der Ordneraktion einbinden.
Dann würde nach der OCR Erkennung direkt mit dem Tagen begonnen werden.
Zur Zeit werden folgende Funktionen ausgeführt.
Es wird das Datum auf dem Papier erkannt und auch zerlegt verwendet.
Es wird der Absender und der Empfänger erkannt
Es wird erkannt Welche Art von Dokumente es sich handelt, Rechnung, Schriftverkehr, Dokument, Kontoauszug…
Es wird erkannt um welchen Betreff es sich handelt.
Die Tag Maschine lernt und es werden nach und nach immer bessere Ergebnisse erzielt.
Es werden Folgende Tags erkannt und auch Generiert:
Komplettes Datum, Jahreszahl, Absender, Empfänger, Dokumentart, Betreff, Es wird ein Archivdatum zum Archivieren des Dokumentes erzeugt, Es wird ein Verfallsdatum des Dokumentes erzeugt. Die Tags werden in den Spotlite Kommentar geschrieben.
Es gibt auch einen Transformer der mehrere Suchergebnisse zu einem bestimmten Wort Transformiert, wie z.B “Fern Universität Hagen”, “FernUniversität Hagen”, “FernUniversität in Hagen” Transformiert zu “FernUniversität Hagen”.
Der Dateiname wird ebenfalls neu erzeugt und hat folgenden Aufbau.
JJJJ-MM-TT-Absender-Empfänger-Dokumentart-Betreff.pdf
Nachdem alle Daten erzeugt wurden und das Dokument manipuliert wurde, wird im Archiv geprüft ob der Ablageordner “Jahr” schon erstellt wurde, wenn nein, dann wird er erstellt und das Dokument dann dort hinein verschoben.Sollte der Dokumentname bereits vorhanden sein, so wird der Name hoch gezählt.
Für DEVONthink würde ich mir vorstellen, direkt in den Eingangsordner der direkten Datenbank zu schreiben statt in den globalen Eingangsordner.
Da benötige ich aber Kontakt zum DEVONthink Entwickler für ein paar Fragen um Anpassungen machen zu können.
Die Übernahmen der Daten aus Spotlite und den Dateinamen zu DEVONthink sind ohne weiteres mit einem Script möglich um Tags und Struktur automatisch erzeugen zu können.
So bis dahin
Viele Grüsse
Michael Madej