Kein OCR bei direkter Übernahme via "zu Devonthink 3 hinzufügen?

Knappe · June 11, 2020, 10:23am

@cgruenberg,

??? die komplette Regel ist doch als Screeenshot oben #9 aufgelistet ?

Blanc · June 11, 2020, 10:43am

Darf ich zusammenfassen, damit ich sicher bin, dass ich dasselbe „sehe“ wie du: wenn du mit einer der o.g. Regeln mit „nach Import“ eine Datei

a) vom Finder in die Inbox fallen lässt oder
b) über „Teilen“ und nach Eingabe dann von Tag/Name/Ziel „Eingang“

in den Eingang ablegst, dann wird die OCR durchgeführt, nicht aber das Verschieben in eine Datenbank? (So verstehe ich deinen letzten Post.) Das würde ja heißen, die Regel an sich funktioniert (von deinen vorhergehenden Posts war ich davon ausgegangen, dass die Regel nicht ausgelöst wird, da haben wir vielleicht an einander vorbeigeredet?). So das so ist, was versuchst du mit der Aktion „in die Datenbank verschieben“ zu machen? Also in welche Datenbank, und dort wohin sollte die Datei verschoben werden?

(Ich habe das Gefühl, dass ich nur dachte zu wissen, was du vorhast - hilf mir bitte nochmal, dir zu helfen)

Knappe · June 11, 2020, 10:46am

nicht ganz:

wenn über “Teilen” das PDF in DT kopiert wird, wird die Regel nicht ausgeführt
wenn die Regel manuell in DT für das kopierte PDF angestossen wird, wird OCR ausgeführt, aber nicht der Teil “in Datenbank veschieben”. Nach OCR ist Schluß --> keine Meldung, keine Abfrage, nichts

Blanc · June 11, 2020, 10:53am

Cool; Criss @cgrunenberg kann das ein Bug sein? Also wenn über die Share/Teilen Funktion eine Datei an DT gesendet wird, dass diese die „on Import“ Regel nicht triggert? Ich kann das selbst gerade nicht ausprobieren.

@Knappe: wie ist es denn, wenn du eine Datei per Drag&Drop in den Eingang ablegst und eine Regel hast die „bei Import“ getriggert wird? Wird dann wenigstens die Regel automatisch bis inkl. OCR ausgeführt?

Die Funktion der Aktion „in Datenbank verschieben“ kenne ich nicht - da muss wer anders seinen Senf dazugeben.

Knappe · June 11, 2020, 10:59am

Ziel:
Beim “Teilen” soll jedes PDF durch OCR laufen.
Für das “Teilen” gibt es in DT scheinbar keine globale Einstellung dafür, wie es sie beim “Import” gibt.

Soll jetzt als Workaround ein "Intelligentes Script eingesetzt werden, muss die Regel irgendwie aktiviert werden. Das erfolgt über den Folder, der im Pflichtfeld “Suchen in” eingetragen werden muss.
Somit landet das PDF erst einmal im falschen Folder und muss nachträglich verschoben werden.
Für dieses Verschieben müsste nach meiner Vermutung die Funktion “in Datenbank verschieben” zuständig sein und nach Aktivierung des Benutzter auffordern, das Ziel einzutragen.

Bei mir wird letztere Funktion gar nicht erst aktiviert.

Knappe · June 11, 2020, 11:10am

Habe in der Erfassungsmaske für die Regel jetzt mal nur “Datenbanken” und keinen speziellen Ordner angegeben --> Das über “Teilen” kopierte PDF wurde im Ordner “Eingang” abgelegt und der OCR-Teil der Regel ausgeführt.
Daraufhin wieder den “Eingangsfolder” direkt zugeordnet --> jetzt wurde wieder OCR ausgeführt.
Gleiches gilt für Drag&Drop aus dem Finder.
Keine Ahnung warum der Teil nun zu funktionieren scheint.

In keinem Szenario wird aber ein Zielordner abgefragt (“in Datenbank veschieben”).
Was kann das jetzt noch für eine Ursache haben ?

Knappe · June 11, 2020, 11:43am

funktioniert auch nicht mit der DT Version 3.5.1 unter High Sierra 10.13.6

cgrunenberg · June 11, 2020, 11:49am

Diese Aktion verschiebt nur indizierte Dateien aus dem Finder in die Datenbank, die Position in der Datenbank bleibt dieselbe. Zum Verschieben in andere Gruppen gibt es die Verschieben-Aktion.

cgrunenberg · June 11, 2020, 11:50am

Möglicherweise. Aus welcher App wurden denn das Dokument geteilt?

Knappe · June 11, 2020, 11:52am

es wird aus “Vorschau” geteilt.

Die Funktion “verschieben” nutzt mir nichts, da hier zwingend ein Zielordner eingetragen werden muss, der dann für alle Files gleichermaßen benutzt wird.

cgrunenberg · June 11, 2020, 11:57am

Sie könnten alternativ die Gruppenauswahl in Einstellungen > Import > Ziel aktivieren.

Knappe · June 11, 2020, 12:04pm

und an welchem Kriterium soll dann die “Intelligente Regel” festgemacht werden ?
Da fehlt dann doch der Trigger ?
Die z.B. aus “Vorschau” zu übernehmenden Dateien sollen doch individuell zum Übernahmezeitpunkt in jeweils verschiedene Ordner einsortiert werden.
Das kann ich mit “Ziel: Gruppe auswählen” erreichen. Dann aber nicht mit OCR oder irgendwelchen anderen speziellen Funktionen, die in einer Regel erfasst werden könnnen.
Deshalb habe ich auch diesen Thread eröffnet.

cgrunenberg · June 11, 2020, 12:23pm

Das ginge dann wohl nur noch mit einem speziellen Script und einer Skript ausführen-Aktion, aber in der Regel ist es nicht empfohlen, dass Regeln Benutzereingaben erfordern, damit sie im Hintergrund arbeiten können.

Knappe · June 11, 2020, 12:49pm

Frage: was möchte ich eigentlich erreichen ?
Antwort: dass die PDF´s, die im DT gespeichert werden, nach der Übernahme durch OCR laufen. Mehr hier eigentlich nicht.

Lösungsansätze:

eine Erfassungsmaske OCR analog für Scans auch für “Teilen” etc. bereitzustellen
in der Maske “Gruppe auswählen” während des “Teilens” eine Checkbox “OCR” mit aufnehmen
die Regeln so zu erweitern, dass auch Aktions- und Funktionsmenü´s aufgerufen werden können.

Scripting heißt Automatisierung. Ist aber nicht gleichzusetzen mit vollautomatisch.
Darum können (müssen aber nicht) Anwenderaktionen sehr wohl Bestandteil eines automatisierten Scripts sein.
Im Endeffekt muss der Benutzer selbst entscheiden, wie er das handhaben möchte.

Ich suche aber für den Zeitpunkt “jetzt” ein Workaround.

Wenn ich das hier also richtig intepretiere, muss ich eine Regel erstellen, die analog der “Automatischer Schutz” augebaut ist ?
Oder hätten Sie einen Scriptentwurf für eine spezielles Script in der “Script ausführen” Aktion ?

cgrunenberg · June 11, 2020, 1:10pm

Wenn das wirklich für alle PDF-Dokumente, die importiert werden, gelten soll, dann würde eine Regel, die in allen Datenbanken nach PDF-Dokumenten ohne Wörter sucht und beim Import ausgeführt wird, völlig reichen, wenn gleichzeitig auch noch die Gruppenauswahl in den Einstellungen aktiviert ist.

suavito · June 11, 2020, 3:19pm

Dasselbe. Und auch verstehen. Vielleicht obendrein noch freundlich sein zu jemandem, der nur helfen möchte:

Zu diesem Zeitpunkt der Unterhaltung ging es erst einmal darum, festzustellen, wo es hakt. Es konnte schon sein, dass die Regel auch beim Auslöser “nach Import” nicht funktioniert, aber das hieß ja noch nicht, dass sie deswegen nicht funktioniert. Alle anderen Fehlerquellen mussten vorher ausgeschlossen werden.

Dass Sie sich die Import-Einstellungen von DEVONthink anscheinend noch nicht angeschaut haben, hatte ich allerdings nicht vermutet.

Läuft denn jetzt wenigstens alles? Sonst stelle ich hier noch Screenshots ein. Ich habe die von Ihnen gewünschte Regel nämlich mal testweise erstellt, und sie funktioniert einwandfrei.

Knappe · June 11, 2020, 3:47pm

Dass Sie sich die Import-Einstellungen von DEVONthink anscheinend noch nicht angeschaut haben, hatte ich allerdings nicht vermutet.

Welche meinen Sie ?

suavito · June 11, 2020, 6:27pm

Die von Christian Grunenberg erwähnte Gruppeneinstellung:

Ich verwende, wie gesagt, die englische Benutzeroberfläche, aber es sollte kein Problem sein, die Einstellung in der deutschen wiederzufinden. Wenn “Select Group” (“Gruppe auswählen”?) angewählt ist, dann landen alle Importe nicht direkt in der Globalen Inbox, sondern man kann jedesmal auswählen, wo gespeichert werden soll. Also genau das, was Sie haben wollen.

Die Datei befindet sich also bereits am richtigen, ausgewählten Ort, bevor die Regel überhaupt zum Einsatz kommt. Und die sieht dann so oder ähnlich aus:

Bildschirmfoto 2020-06-11 um 20.13.29

Falls Sie sich wundern, warum der letzte Schritt “Delete” heißt: Tatsächlich wandelt DEVONthink die PDF-Datei ohne Text nicht in eine PDF-Datei mit Text um, sondern erzeugt eine neue PDF-Datei mit Text aus der ohne. Die alte kann man dann löschen. Oder sie irgendwo sichern, wie man möchte. Zum Testen können Sie diesen Schritt aus Sicherheitsgründen auch erst einmal weglassen.

Sollte es mit dem Auslöser “nach Import” weiterhin Probleme geben, könnten Sie weitere mögliche Auslöser hinzufügen. Sie könnten auch auf einen zeitlichen Auslöser setzen, minütlich zum Beispiel. Aber Vorsicht, überlegen Sie sich gut, was es heißt, wenn diese Regel jede Minute Ihre sämtlichen offenen Datenbanken scannt. Und ob Sie vielleicht viele alte PDF-Dateien ohne Text-Layer haben. Die würden dann auch alle konvertiert, und der erste Durchlauf dieser Regel könnte das Programm eine Weile beschäftigen.

cgrunenberg · June 12, 2020, 7:11am

OCR > Anwenden ist eine Alternative zu diesen beiden Aktionen.

suavito · June 12, 2020, 7:18am

Darauf hätte ich auch selbst kommen können. Müssen. Ich habe mit OCR in Skripten noch nichts vorher gemacht, aber viel mit Konvertierungen von Files, und da entsteht immer eine neue Datei. Das hat mich wohl auf die falsche Spur gelockt. Aber funktioniert hat meine Variante immerhin auch.