Safari - Webclipper - PDF-Seite mit Cookiewarnung

Hallo zusammen,
ich wollte ein Rezept von einer Website in DT3 speichern, und habe dabei den Webclipper in Safari nehmen wollen.
Als Format habe ich PDF ausgewählt.
Das Resultat enthält aber leider den Popup mit den Cookie-Einstellungen von der Seite, ohne dass dieser Popup im Zeitpunkt der Speicherung tatsächlich vorhanden gewesen wäre.
Was mache ich hier falsch?
Leckerer Joghurt selbstgemacht – mit dem Sous-Vide-Stick.pdf (281.3 KB)

Vermutlich hast du gar nichts falsch gemacht. DT wird einfach die URL noch einmal laden, in seiner eigenen Inkarnation von Webview. Da ist das blöde Banner noch nicht abgenickt.
Drucken/ nach DT im Browser sollte helfen.

Ja, der Druckdialog funktioniert einwandfrei.
Aber das ist ja vermutlich nicht der Sinn des Clippers?
Hier wäre es dann vermutlich sinnvoll, entweder einen zusätzlichen Dialog einzuführen, mit dem das Problem dann gelöst werden kann, oder aber eine Funktion in den Clipper eingebaut werden, die das Problem von selber löst.
Wenn ich mir vorstelle, ich sitze hier bei einer Recherche, lade mir alle möglichen Seiten in DT3, und stelle dann hinterher erst bei der Auswertung fest, dass diese unbrauchbar sind, das würde mich schon irgendwie ärgern.

In dem Zusammenhang stellt sich mir auch die Frage, wenn der Clipper tatsächlich einen eigene Sitzung nutzt, und die Seite darin erneut aufruft, was ist den dann mit Seiten, die ein Login benötigen, oder mit solchen in denen man z.B. in eine Formular etwas eingegeben hat, was man sichern möchte?

Dieses Thema ist hier schon x-mal durchgekaut worden. Es gibt keine immer funktionierende Lösung für das Problem, auch nicht für die Aufgabe, eine Webseite überhaupt zu “speichern” (dynamische Inhalte …).

macOS teilt Cookies nicht zwischen Anwendungen (“Apps”), sodass dem Clipper m.W. nichts anderes übrig bleibt als in diesem Sinne eine eigene Sitzung aufzumachen. Für Webseiten die du regelmäßig Clipst kann eine Lösung sein, die Webseite einmalig im Browser in DT aufzumachen und die notwendigen Cookies zu setzen (z.B. indem du den Banner wegklickst). Ansonsten pflichte ich aber @chrillek vollumfänglich bei - es gibt keine immer funktionierende Lösung; viele Webseiten wollen erkennbar nicht, dass du ihre Inhalte speicherst - entsprechend schwierig ist es dann auch.

Insgesamt habe ich die besten Erfolge mit Clippern als Markdown; eines der Seiten von der ich regelmäßig clippe lässt sich nur als HTML clippen; eine intelligente Regel wandelt den Clip hernach in PDF um. Je öfter du die Seite clippst, desto mehr lohnt es sich nach individuellen Lösungen zu suchen. Bei manchen habe ich festgestellt, dass sich der Aufwand für mich nicht lohnt…

1 Like

Ich möchte ja gar nicht bestreiten, dass es Websites gibt, die vom Aufbau her kompliziert sind, bzw. die auch aus Gründen des Urheberschutzes etc. eine Speicherung vermeiden wollen.
Aber hier habe ich eine Website, bei der es völlig problemlos möglich ist diese als PDF über den Printdialog von Safari zu speichern.
Dann sollte doch der Webclipper nicht “komplizierter” sein, als das was der Browser von Haus aus kann, da ich dann keine Erweiterung hierfür benötigen würde.
Wenn ich bei dieser Erweiterung jedesmal kontrollieren muss, ob das was ich speichern wollte, auch das ist, was gespeichert wurde, dann macht es das Ganze irgendwie unnötig kompliziert, bzw. für den “Otto-Normal-Anwender” wenig nutzbar.

Das würde voraussetzen, dass der Webclipper Zugriff auf dieselben Funktionen/Routinen hat wie der Browser selbst; ob dem so ist entzieht sich meiner Kenntnis. Der Clipper funktioniert aber erkennbar anders als die Print-Funktion - die wiederum nach meiner Erfahrung auch regelmäßig nutzlos ist. Nach meiner Erfahrung bleibt es dabei: Es gibt keine universelle Methode Webseiten zu speichern. Um eine Ergebniskontrolle komme ich nur bei Webseiten für die ich spezifische Verfahren eingerichtet habe drumherum. Zufriedenstellend ist das kaum; aber für mich alltägliche Tatsache.

1 Like

Der Clipper unterstützt noch weitere Formate, die Safari nicht von sich aus bietet. Wie übrigens auch pdf nichts mit Safari selbst zu tun hat: Das ist kein Feature von Safari, sondern von macOS, das auch mit Firefox (bspw) funktioniert.

Edit: dazu gab es schonmal ausführlich was: What to (not) expect when saving HTML documents in DEVONthink - #6 by chrillek

Fügen Sie ein Lesezeichen für die Website in DEVONthink hinzu und melden Sie sich dort an. Dann schneiden Sie die Seite direkt in DEVONthink aus.
Funktioniert das wie erwartet?

(Übersetzt mit https://deepl.com)

Ich habe die Seite als Webarchiv nach DT3 geladen, und hier konvertiert. Angezeigt wird dies in DT3 allerdings als “Web-Internetadresse”
Als PDF kommt das oben angezeigte Ergebnis heraus, also inclusive der Cookiebox.
Bei der Konvertierung dann in ein Web-Archiv wird nur noch ein farbiges Feld angezeigt, dass der Farbe des Hintergrundes der Cookiebox entspricht, der Seiteninhalt ist aber als HTML offenbar noch vorhanden.

Ähh, und Safari ist doch gleich von wem genau programmiert worden?
Ich dachte bisher immer, das wäre Apple gewesen, Du weist schon, die mit dem macOS?

Ich verstehe nicht so ganz, worauf Du hier mit diesen Spitzfindigkeiten hinaus willst?

Ich kann die Bitte nach einem Webclipper, der die Cookie-Banner ignoriert, nur unterstützen. Ich nutze Devonthink fast nur zum Clippen von Webseite und dass der Webclipper das nicht richtig kann, reduziert für mich dem Wert von Devonthink enorm.

Evernote kann das fast bei jeder Webseite, es ist also technisch möglich, das umzusetzen. ich bin von Evernote auf Devonthink umgestiegen und bin eigentlich ganz zufrieden, aber wegen des unzulänglichen Webclippers bin ich kurz davor, wieder zurückzuwechseln. Ich könnte mir vorstellen, dass es einigen Usern so geht.

Das mag sein.

Warum DT sich so “komisch” verhält

Allerdings hat Evernote einen anderen Fokus als DT – bei letzterem ist “Clipping” nur eine von vielen Funktionen. Und die ist, zumindest wenn ich mir das Firefox-Add-On anschaue, sparsamst realisiert. Im Wesentlichen ruft sie das URL-Kommando x-devonthink://clip auf, und zwar mit der URL, die Du gerade im Browser siehst.

Das heißt aber, dass das Programm DT das eigentliche Clipping übernimmt, nicht das Add-on. Was wiederum heißt, dass DT die Webseite, die du nach dem Cookie-Abnicken siehst, nicht sieht. Sondern es bekommt nur die URL. Und die lädt es, um Clippen zu können. Das passiert in einem eigenen “Browser”, der nichts davon weiß, dass Du die Cookies schon abgenickt hast. Genau dasselbe gilt übrigens auch für Webseiten, auf denen Du Dich anmelden musst: DT weiß nix von deiner Anmeldung, also musst Du es dort noch einmal tun.

Könnte man das anders realisieren?

Könnte man. Dafür müsste man aber ein ganz, ganz anderes Add-on schreiben (was Evernote vermutlich getan hat). Das müsste selbst alle möglichen Konvertierungen (nach Text, nach MD, nach aufgeräumten MD, nach PDF, nach …) erledigen. Man kann sowas z.B. für MD mit einem minimalen Scriptlet selbst machen (<werbung>Mit Turndown HTML in Markdown wandeln | iX | Heise Magazine</werbung>). Vielleicht ließe sich das auch für PDF erledigen.

Fun fact: Der Evernote-Clipper für Firefox hat 3,22 MByte, und das ist komprimierter Code! Er hat eine Bewertung von 3,5 Sternen (von 5 möglichen): 514 Stimmen für 5, 300 für 1 Stern (und weniger als einen kann man nicht vergeben). Das spricht, finde ich, nicht für ein rundum perfektes Produkt.

Also: ein Add-on, dass das für beliebige Formate erledigt, dürfte eben relativ groß werden. Und aufwendig. Und womöglich Browser-abhängig (also je eins für Chrome, Safari, Opera, Firefox, …). Wäre ich Entscheider bei DT, würde ich dazu “nein” sagen: Clipping ist nur eine kleine Funktion, und dafür einen derartigen Aufwand zu treiben (mit einem Rattenschwanz an Wartung und möglicherweise Anpassungen bei Browser-Updates) lohnt nicht.

Könnte man unter Monterey einen Shortcut benutzen?

Könnte man, wäre Shortcuts nicht komplett kaputt. Es gibt zurzeit schlicht keine Möglichkeit, auf macOS Daten von einer App (außer Finder) an einen Shortcut weiterzureichen. Zilch. Kein Share-Sheet, kein Dienst. Das Zeug ist von vorn bis hinten Kröpelkram: keine Dokumentation, keine sinnvollen Beispiele, kein Support innerhalb der Apple-Apps, keine Plattform-Neutralität (vulgo: was auf i*OS geht, geht nicht auf macOS und umgekehrt).

1 Like

Außerdem gibt es bereits ein paar Möglichkeiten, bei betroffenen Webseiten das Problem zu umgehen. Unter anderem…

  1. Ein PDF nach DEVONthink drucken
  2. Ein Webarchiv (Safari) in den globalen Eingang speichern
  3. Services (u.a. Take Plain/Rich Note)
  4. Die Webseiten direkt in DEVONthinks Browser clippen, also z.B. zunächst nur ein Lesezeichen hinzufügen
1 Like

Sorry, aber das ist doch nun wirklich Unfug!
Der Webclipper ist nicht nur eine kleine Funktion in DT3, sondern ein zentrales Element, das auch herausgehoben beworben wird.
DT3 macht große Werbung damit, dass es als Instrument für die Recherche genutzt werden kann, und das ganze Konzept mit Clipper, Sorter und globalem Eingang ist auf genau diese Funktion auch (theoretisch!) ausgelegt.
In einem Zeitalter, wo ein erheblicher Teil der Recherche in einem Browser stattfindet, gehört eine Möglichkeit, die Ergebnisse schnell und sicher zu speichern, schlicht dazu!
Auch kann es nicht Sinn der Sache sein, dass ich eine Website in DT3 über den Clipper speichere, und danach im Detail ersteinmal ergründen muss, ob dies nun auch wirklich geklappt hat, oder nicht.
Wenn ich eine zeitlang eine Recherche betreibe, dann kann ich eine solche Ablenkung nicht gebrauchen, und sie ist im Ergebnis auch sehr teuer, weil sie zusätzliche Arbeitszeit kostet.
Es stellt dann aber auch eine, vorsichtig ausgedrückt, Zumutung dar, wenn ich dann damit rechnen muss, dass zumindest ein Teil meiner Rechercheergebnisse Müll sind, weil DT3 das nicht verarbeitet bekommt.
Und wenn ich über den Drucker von Safari gehen möchte, dann tue ich das, aber dann brauche ich keine zusätzliche Extension, für die ich im Ergebnis als Kunde mit bezahle, und die nicht funktioniert!

Selbst wenn es DT hier sich mit der Programmierung des Clippers sehr einfach gemacht hat, dann ist dies keine Begründung dafür, dass es nicht funktioniert! Entweder die Funktion wird beworben, und angeboten, dann muss sie funktionieren, oder aber sie funktioniert (bewusst!?) nicht, dann gehört sie abgeschaltet, damit man sich dann einen funktionierenden Workaround suchen kann!
Und das es dann noch nicht einmal beim Clipper eine Abfrage für die Cookies gibt, oder DT3 diese von sich aus ausschließt, macht es nicht besser!

Übrigens @cgrunenberg gerade Punkt 4 klappt überhaupt nicht, wie ich gerade anhand der betroffenen Website gesehen habe!
Das ist also wirklich kein guter Vorschlag, und der Punkt 2 ist offenbar auch nicht sinnvoll, da der Clipper ja offenbar, zumindest manchmal, nicht einmal ein Webarchiv anlegt, sondern nur eine “Web-Internetadresse”. Und selbst wenn das mit dem Webarchiv klappt, dann gibt es scheinbar noch einen Pop-Up-Blocker, der die Anzeige der Cookiebox verhindert, und damit die Seite unbrauchbar macht.

Alles in allem ein sehr schwaches Bild, leider mal wieder!

1 Like

So kann man es natürlich auch sagen. Wenn man keinen Wert auf ausführliche, fundierte Antworten legt.

1 Like
  1. Was genau funktioniert beim Druck als PDF aus z.B. Safari nach DEVONthink konkret nicht?

  2. Es geht darum, ein Webarchiv (s. Ablage > Sichern unter…) oder auch PDF (s. Ablage > Als PDF exportieren…) von Safari in DEVONthinks Eingang zu speichern. Vom Clipper war nicht die Rede.

Es gibt übrigens auch noch die Option Aufgeräumt im Clipper, die störende Elemente wie Cookie-Warnungen entfernen sollte.

Ich lege keine Wert auf langatmige Ausflüchte, warum ein von mir bezahlte Produkt nicht funktioniert, dann noch verbunden mit der Behauptung, es wäre ja ohnehin nur eine Nebensache!
Ich lege Wert darauf, dass das was ich bezahle, auch seinen Wert und seine zugesagte Funktion hat!

Das Safari das kann, steht doch hier gar nicht zur Debatte!?
Es geht darum, dass DT es nicht kann, obwohl es dafür extra eine Funktion hat.
Und die Option “Aufgeräumt” ist sicherlich ganz nett, aber entfernt eben auch mehr oder weniger unkontrollierbar, irgendwelche Elemente.
Darüber hinaus speichere ich Websites mitunter gerade wegen der gerichtsfesten Dokumentation von zusätzlichen Elementen, da bringt es mir überhaupt nichts, eine Funktion nutzen zu müssen, um eine Cookiebox zu umgehen, die mir dann die Elemente die ich benötige aus der Website löscht.

Übrigens, interessanter Weise habe ich gerade auch folgendes zusätzlich festgestellt:
Speicher ich die Seite als Webarchiv über den Clipper, und rufe vorher die “Vorschau” im Clipper auf, dann wird mir die Seite in der Vorschau ohne Cookiebox angezeigt.
Im globalen Eingang ist sie dennoch mit der Cookiebox hinterlegt.
Wenn also die Theorie von @chrillek stimmt, und der Clipper nutzt nur die URL in einem eigenen Browser, wieso wird dann die Vorschau im Clipper ohne die Cookiebox angezeigt?