Unterschiedliche Suchergebnisse in DTTG und DTPO


#1

Hallo,

mich verwundert, dass ich in DTTG und DTPO unterschiedliche Suchergebnisse erhalte wenn ich nach einem bestimmten Begriff suche? So liefert DTTG einen Treffer und DTPO ganze sieben (Suche nach Allem in Datenbanken) für einen konkreten Begriff. Dies ist sehr irritierend, vor allem da ich DTTG viel beruflich einsetze und auf gute Suchergebnisse angewiesen bin. Hat jemand eine Idee?

Grüße

Norman


#2

macOS ≠ iOS. Die zugrunde liegenden Technologien für die Suche in DEVONthink und DEVONthink To Go sind nicht die gleichen.

(Übersetzt mit https://deepl.com)


#3

Ist evtl. die Option “Präfix während Eingabe” auf dem Mac aktiviert? Dann wird * automatisch an das letzte Wort angehängt.


#4

Hallo,

leider konnte ich die Option nirgendwo (Einstellungen oder Menü) finden. Im Suchdialog sind folgende Optionen aktiviert:

Auf dem iPad erhalte ich folgendes Ergebnis:

Der Begriff “ardoer” ist hierbei in den Dokumenten in der Regel Teil einer E-Mail-Adresse (Ardoer.com oder info@ardoer.com oder www.ardoer.com). Auf dem iPad wird ausschließlich das Dokument gefunden bei welchem der Begriff ohne Präfix oder Suffix enthalten ist:

Ich habe auf dem iPad versucht mit folgenden Suchbegriffe (z.B. “ardoer*”, “ardoer”) oder regulären Ausdrücke zu suchen, jedoch war keine Suche erfolgreich.

Selbst wenn ich nach dem genauen Begriff "pekelinge@ardoer.com" suche, welcher in einem der PDFs enthalten und in DTPO gefunden wird, erhalte ich in DTTG kein Ergebnis.
Des Weiteren erhalte ich auch kein Ergebnis wenn ich direkt nach dem Dokumentennamen (2018-04-07 - De Pekelinge - Buchungsbestätigung - Buchungsbestätigung.pdf) suche. Wie auf den nachfolgenden Screenshots ersichtlich scheinen Sonderzeichen die Suche zu behindern. Suche ich in der Gruppe (Rechnungen) in der das Dokument liegt nach “2018” erhalte ich Ergebnisse (32 Resultate). Suche ich jedoch nach “2018-” erhalte ich keine Ergebnisse (0 Resultate) obwohl alle vorher gefundenen 32 Files im Dateinamen mit “2018-” beginnen.

Vielen Dank für die Mühe!

Grüße

Norman


#5

DT und DTTG nutzen eine völlig unterschiedliche Such-Engine. Dennoch kann ich diesen Fall nicht verstehen, zumal ja das Suchresultat bei DTTG deutlich besser zu sein scheint in diesem konkreten Fall. Evt kann Jim von DT Dir helfen?


#6

Vielleicht übersehe ich ein Detail, aber in obigem Fall scheint es genau andersrum zu sein.


#7

sorry stimmt. wie kann man erklären, dass DTTG die datei nicht findet?


#8

Zum Teil werden weniger (Meta-)Daten indiziert als auf dem Mac (u.a. nur der Betreff von Emails, nicht aber weitere Header), aber ob das hier der Fall ist, ist schwer zu sagen, da ja auch PDFs betroffen zu sein scheinen. Ich hab’ das mal weitergeleitet.


#9

Danke!
Bei der Suche nach “2018-” könnte ich mir ja noch ein Escaping-Problem bei regulären Ausdrücken erklären aber der andere Fall “ardoer” sieht für mich als Anwender danach aus, als würden nur Treffer für das direkte Auftreten (z.B. " ardoer “) und nicht für “Substrings” (z.B. "info@ardoer.com”) ermittelt.
Ohne den Quellcode zu kennen ist das aber nur eine Vermutung.


#10

Wenn Sie in DEVONthink To Go suchen, wird am Ende des letzten Suchbegriffs ein Sternchen angenommen. Sobald Sie Return drücken, wird der Platzhalter verworfen und der Begriff als Wort behandelt.


#11

Dies bedeutet, wenn ich es richtig verstanden habe, dass ich bei Eingabe in das Suchfeld ein Live-Preview der Ergebnisse erhalte, ein Teil dieser Ergebnisse jedoch verschwindet wenn ich Return drücke. Es sei denn ich gebe manuell ein * ein.

Darf ich fragen weshalb die Suche so umgesetzt wurde? Ich finde das aus Usability-Gründen etwas unglücklich. Insbesondere im Deutschen, mit seinen vielen zusammengesetzten Wörtern wie die bekannte “Dampfschifffahrtsgesellschaft” (steamship company) macht es die Suche kompliziert. Im Englischen ist das kein Problem, dort treten alle Wörter sauber getrennt auf.

Ich habe daher noch einmal einen Test durchgeführt und ein Text-File erzeugt, welches den Dateinamen “Platzhaltertest” (placeholder test) besitzt. Suche ich in DT nach “halter” wird die Datei nicht gefunden. Erst eine Suche mit “*halter*” findet die Datei. In DTTG führt keine der Suchen zu einem Ergebnis, anscheinend werden führende * (Asterisks) aus dem Such-String entfernt, da erst die Suche nach “Platzhalter*” ein Ergebnis liefert.
Interessanterweise findet DT bei der Suche nach “halter” eine PDF-Datei die das Wort “Sozialverhaltens” enthält (Unscharfe Suche aktiviert). Es scheint, dass die Suche im PDF-Content anders arbeitet als die Suche nach Dateinamen oder TXT-Content.


#12

Bei der Hervorherbung von Fundstellen sucht das PDFkit von macOS prinzipiell nur nach Substrings, eine zukünftige Version wird dieses Problem umgehen.


#13

Das Verhalten ist nicht neu. Es folgt dem Verhalten des Suchfeldes von DEVONthink, wenn Präfix während der Eingabe aktiviert ist.

Präfixe Wildcards werden in DEVONthink To Go derzeit nicht unterstützt.


#14

Hallo IDIC,

ich hatte bislang auch schon meine liebe Müh’ mit der Suche:

und ich halte - auch wenn das Verhalten nicht neu ist - die Suche leider auch für nicht wirklich benutzerfreundlich. Grundsätzlich ist man von allen großen Suchmaschinen gewohnt, dass eine Substring-Suche durchgeführt wird.

Bezüglich der Wildcards:

In der Hilfe von DTTG wird angegeben, dass Wildcards nur am Ende des Suchbegriffes verarbeitet werden. Stellt man diese an den Anfang, so funktionieren sie nicht.

Bezüglich der Hervorhebung im PDF:

Das PDFkit funktioniert augenscheinlich nicht genauso wie die Suche und markiert auch Substrings.

Ich würde mich freuen, wenn die Suchen von DT und DTTG zeitnah im Einklag mit dem PDFkit und auch sich selbst funktionieren. In meinen Augen ist die Suche das wichtiges Werkzeug einer Datenbank bzw. einer großen Datensammlung.

Und wenn sie dann auch standardmäßig mit Substrings suchen, wäre das genial. So beginne ich jede Suche immer mit * und ende mit *.


#15

Hallo,

vielen Dank an alle für die Erläuterungen, welche sich mit meinen Erfahrungen decken. Mit all den Informationen wird die Suche für mich deterministischer.

Als Softwareentwickler weiß ich, dass Entscheidungen die man vor Jahren getroffen hat und die damals richtig waren nicht zwingend heute noch einmal getroffen werden würden. Auch ich habe unseren Kunden schon häufig “das war schon immer so” geantwortet, auch wenn ich genau wusste, dass das Verhalten der Software aus heutiger Sicht nicht für alle Zielgruppen wünschenswert ist.
Ob dies in diesem Fall so ist kann ich natürlich nicht einschätzen. Für mich, als jemanden der von Evernote zu DT(TG) gewechselt ist und der als Deutscher viele zusammengesetzte Wörter verwendet, wäre eine (ggf. optionale) Substring-Suche natürlich genial.

Ich hatte bisher angenommen, dass DT(TG) die Dokumente nach dem Hinzufügen / Ändern analysiert und einen / mehrere Suchbäume (Trie) für alle Strings aufbaut, so dass die Funktion der Suche unabhängig vom Dateityp ist. Aus den bisherigen Ausführungen schließe ich jedoch, dass die Suche, ganz sicherlich aus guten Gründen, anders implementiert ist (z.B. Phrase Trie).

Ich weiß daher jetzt, dass die Suche nicht alle gewünschten Ergebnisse liefern wird und werde daher noch sauberer in Gruppen / Tags sortieren, so dass ich die Informationen unabhängig von der Suche finden kann.


#16

Eine zukünftige Version wird die bisherigen Schwachstellen von PDFkit umgehen, so dass dies konsistent wird.


#17

Ja, die unterschiedliche Indizierung und die unterschiedliche Query-Syntax in DTP vs. DTTG haben mich auch des öfteren ausgetrickst. :frowning:

In einer iOS App kann man auf dem Gerät nicht alles so programmiern wie auf 'nem Mac. Deshalb ist klar, dass DTTG nicht alles genauso machen kann wie DTP.

Auf dem Mac hat man allerdings mehr Programmier-Freihet, weshalb es in DTP einen Suchmodus geben könnte, der genauso arbeitet wie DTTG. Das wär doch für Leute, die beide Apps häufig nebeneinader nutzen, ein tolles Feature, oder? :slight_smile: