Dies sollte per AppleScript machbar sein, ein Anfang wäre folgendes Skript, das die ausgewählten Dokumente nach den Wörtern Test & House durchsucht und ggf. “tagged”:
property pKeywords : {"Test", "House"}
tell application "DEVONthink Pro"
set theSelection to the selection
repeat with theRecord in theSelection
set theText to plain text of theRecord
set shouldTag to false
set theTags to tags of theRecord
repeat with theKeyword in pKeywords
if theText contains theKeyword then
set theTags to theTags & theKeyword
set shouldTag to true
end if
end repeat
if shouldTag then set tags of theRecord to theTags
end repeat
end tell
Das ist natürlich realisierbar, aber dazu wären ein paar weitere Informationen nützlich. Z.B. wie genau die Ordnerstruktur aussieht, in die die Dokumente verschoben werden sollen.
Leider hab ich jetzt erst wieder Zeit gefunden mich der Thematik zu widmen. Sorry für die späte Rückmeldung.
Also am besten mal am Beispiel:
Ich füge ein JPEG in den Eingang ein.
Dieses JPEG soll nun automatisch via OCR in ein PDF umgewandelt werden
Jetzt soll in dem Dokument nach dem Begriff “Infineon” gesucht werden. - wird dieser Begriff gefunden, soll getagged werden mit dem Tag “Infineon” - diesen Tag gibt es evtl. schon. Falls es diesen gibt, darf er natürlich kein 2tes Mal angelegt werden.
Jetzt soll zusätzlich in dem Dokument nach “Effektenabrechnung” gesucht werden. Wird das Wort gefunden soll automatisch das PDF vom Eingang in die bereits bestehende Gruppe “Effektenabrechnungen” verschoben werden
Das alles bräuchte ich als Beispiel in einem Script, dass ich dann ggf. um weitere Begriffe erweitern kann.
Nebenbei:
Gibt es bereits Anforderungen dazu, dass solche Logiken in Prozessen als Funktion ins Programm eingebunden werden können? Ich fände es toll, wenn man solche Regeln in den Einstellungen einfach anklicken könnte, ohne dass man “rumscripten” muss.
Falls es diese Anforderung bereits gibt, kann man schon absehen wann das ins Programm implementiert wird?
property pKeywords : {"Infineon"}
property pGroupNames : {"Effektenabrechnung"}
tell application "DEVONthink Pro"
set theSelection to the selection
repeat with theRecord in theSelection
set theText to plain text of theRecord
set shouldTag to false
set theTags to tags of theRecord
repeat with theKeyword in pKeywords
if theText contains theKeyword then
set theTags to theTags & theKeyword
set shouldTag to true
end if
end repeat
if shouldTag then set tags of theRecord to theTags
repeat with theGroupName in pGroupNames
if theText contains theGroupName then
set theDatabase to database of theRecord
set theGroups to (parents of theDatabase whose name is theGroupName)
repeat with theGroup in theGroups
if tag type of theGroup is no tag then
move record theRecord to theGroup
exit repeat
end if
end repeat
end if
end repeat
end repeat
end tell
Es steht auf unserer Liste, einen genauen Zeitplan gibt es dafür aber nicht.
Das geht auch, aber dann läuft das Skript natürlich eine Weile:
-- Automatic OCR, filing & tagging (based on keywords)
property pKeywords : {"Infineon"}
property pGroupNames : {"Effektenabrechnung"}
tell application "DEVONthink Pro"
set theSelection to the selection
repeat with theRecord in theSelection
set theText to plain text of theRecord
if theText is "" and (type of theRecord is picture or type of theRecord is PDF document) then
set originalRecord to theRecord
set theRecord to convert image record theRecord
if theRecord is not missing value then
delete record originalRecord
end if
set theText to plain text of theRecord
end if
set shouldTag to false
set theTags to tags of theRecord
repeat with theKeyword in pKeywords
if theText contains theKeyword then
set theTags to theTags & theKeyword
set shouldTag to true
end if
end repeat
if shouldTag then set tags of theRecord to theTags
repeat with theGroupName in pGroupNames
if theText contains theGroupName then
set theDatabase to database of theRecord
set theGroups to (parents of theDatabase whose name is theGroupName)
repeat with theGroup in theGroups
if tag type of theGroup is no tag then
move record theRecord to theGroup
exit repeat
end if
end repeat
end if
end repeat
end repeat
end tell
Zwischenzeitlich sind nun 4 1/2 Jahre vergangen. Die Anforderung dies als Anwender selbst über Optionen zu steuern, steht ja auf Eurer Liste.
Darf man fragen, ob und wann eine Realisierung geplant ist? Muss ich nochmal 4 1/2 Jahre drauf warten?
Nein, ich weiß auch nicht ob das meine Anforderung innerhalb von DevonThink erfüllen wird.
Ich möchte eine Lösung innerhalb von DT nicht noch ein Drittprogramm installieren.
Wenn du auf dem Mac diverse Dinge automatisieren willst, dann kommst du an Hazel nicht vorbei. Ein systemweit funktionierendes sehr mächtiges Tool. Ich habe mein System so eingerichtet, dass erst Hazel die “Drecksarbeit” übernimmt (Datum extrahieren, umbenennen, taggen etc.) bevor die Dateien an DTPO übergeben werden.
ich verstehe aber nicht wie mir Hazel nach OCR bei dem automatischen Verschieben vom Eingangsordner in bestimmte DevonThink Datenbanken in bestimmte Ordner der Datenbank helfen soll.
Klar auf Finder Ebene vielleicht eine tolle Sache aber doch nicht innerhalb von DT.
Oder hab ich was übersehen?
nein. Hazel kann aufbereitete Dokument nur an den Ordner “Inbox” übergeben, das wars. Dann liegt es im DTPOP-Eingang… mehr nicht.
Eine Integration/übergreifende Interaktion exisitiert nicht. Und wenn ich die zwischen Deiner Anforderung, mehrenen ergänzenden Nachfragen auch in anderen Threads berücksichtige, schenke ich den Ankündigungen hier keinen Glauben mehr.
Ich bin DT Neuling und versuche so viel wie möglich DT oder aber Drittprogramme wie Hazel machen zu lassen. Deshalb durchforste ich immer wieder mal das Forum hier.
Ich weiß jetzt natürlich nicht wie Euer Stand ist, aber unter folgenden Links findet Ihr eine Anleitung, wie man durch Hazel vorsortierte Dokumente in die entsprechenden DT Ordner importieren lassen kann. Ob es funktioniert, kann ich momentan leider (noch) nicht sagen, da ich mich erst mit dem Script vertraut machen muss.
Wenn Ihr durch das Script durchblickt, lasst es mich bitte wissen…
Ich habe Ihre Anforderungen an DT schon verstanden. Auch ich wäre dankbar, wenn das so funktionieren würde, tut es anscheinend aber nicht.
Und da hier Hazel angesprochen und behauptet wurde, dass ein entsprechender WorkFlow nicht möglich sei, habe ich versucht an der Lösung des Problems beizutragen.
Ich nutze zur OCR Analyse OCRKit, funktioniert bisher problemlos. Ich hatte vorher auch einen WorkFlow mit PDFpen gefunden und mit der Probeversion problemlos umsetzen können. Da ich aber PDF Expert schon als Bearbeitungssoftware habe und ich nicht eine weitere, vollständige PDF-Software brauche und auch nicht bezahlen wollte habe ich es mit OCRKit (33 €) versucht.
Allerdings muss ich dazu sagen, dass ich noch keine selbst eingescannten sondern nur geschützte PDF-Dokumente bearbeitet habe.
Jetzt werde ich mich mal an das Importieren der PDF-Dateien in die richtigen Ordner von DEVONthink versuchen. Vielen Dank noch mal!