[DevonThink Pro] Webseiten archivieren

Hallo,

ich beschäftige mich gerade mit DevonThink um es besser kennen zu lernen.
Mein Punkt ist das Archivieren von Webseiten und habe schon einiges vorher hier im Forum drüber gelesen. Allerdings habe ich noch Verständnisfragen, mit der Hoffnung eine Antwort zu erhalten:

  1. Gut gelöst ist das Anlegen von Webarchiven. Warum allerdings lässt DevonThink es zu, dass von der Seite gesteuert der Kontakt zur Außenwelt erlaubt wird. Insbesondere bei dem Versuch irgendwelche Analyse- (Google) oder Werbe-Dienste zu erreichen. Ein Archiv ist für mich ein eingefrorener Zustand, sonst könnte ich gleich HTML-Links speichern, und hier will man sich ja vom Format her unterscheiden.

  2. Beziehe ich mich bei Webarchiven auf den Inhalt, so kann ich auf das Layout und Design verzichten. Also getrost auf ein allgemeines Format wie RTFD umsteigen. Warum werden Bilder nicht in der Originalgröße angezeigt und in verschiedenen Versuchen reproduziert als Thumbnail verkleinert, um zusätzlich als Link ergänzt über das Netz das Originalbild nachzuladen?
    Verschiedene Einstellungen habe ich im Bereich “Media” ausprobiert.

  3. Wie kann ich aus vorher angelegten Webarchiven eine RTFD-Datei erstellen? Das Maus-Kontext- oder Aktionen-Menü bietet solch eine Funktion nicht an (oder ich habe vor lauter Bäume den Wald nicht gesehen).

Vielen Dank im Voraus

Thomas

Das Webarchiv-Format mit all seinen Eigenheiten & Schwächen wurde von Apple für Safari eingeführt und wird nahezu komplett vom WebKit-Framework von macOS gehandhabt. Es empfiehlt sich eigentlich nur bei dynamischen Webseiten, ansonsten ist ein PDF-Dokument meistens die bessere Wahl, sofern das Layout wichtig ist. Falls eine nachträgliche Bearbeitung am wichtigsten ist, sind RTF(D)-Dokumente eine gute Wahl.

Bei welcher Webseite passiert dies konkret?

Über das Menü Daten > Konvertieren.

Zum Beispiel bei http://www.admin-magazin.de/Das-Heft/2013/03/ZFS-unter-FreeBSD-Datensicherheit-auf-neuen-Wegen bei der Abbildung 1. Ich habe zuvor im Webarchiv die Werbung am rechten Rand und die Infos im Fuß ab dem Bild entfernt.

Vielen Dank. Jetzt gefunden. Leider wird nicht Bezug auf den reinen Inhalt gemacht, wenn ich ein Webarchiv in ein RTF konvertieren lasse. Im folgendem Beispiel gehe ich davon aus, dass ich nahezu das gleiche Ergebnis erhalte, wie ich per HTML sehe. Vielmehr werden im konvertierten Ergebnis Rahmen eingebunden, die den Inhalt sehr nach recht verschieben.
Beispiel: https://code.tutsplus.com/tutorials/20-best-css-animations–cms-27561

Auf den ersten Blick scheint das hier wie erwartet zu funktionieren. Eine Alternative wäre übrigens noch die Verwendung der Instapaper-Option in Clip to DEVONthink oder der Safari-Reader-Darstellung, um solche Seitenelemente automatisch zu entfernen.

Die Konvertierung wird von macOS durchgeführt, allerdings sind das prinzipielle Einschränkungen. Die Möglichkeiten von HTML und RTF(D) unterscheiden sich stark.

Um dennoch Webseiten ohne jegliche Ursprungsverlinkung zu erhalten, Kopiere ich die Inhalte der Original-Webseite in die Zwischenablage. Lege eine neue Datei im HTML-Format an und füge dann den Inhalt aus der Zwischenablage hinein.

So habe ich den Inhalt archiviert und nutze ein Standardformat, neben dem RTFD natürlich.

Auf den ersten Blick funktioniert dies auch, Inhalte und Formatierung werden übernommen. Nur bei den Bildern werden diese aus den Original-Quellen verlinkt. Das vermeintliche Archiviert läd die Bilder nach.

Wie kann ich Devonthink dazu bringen, Webseiten aus der Zwischenablage in die neue Datei einzubetten und Bilder ebenfalls herunterzuladen und lokal zu verwenden? Der Paketinhalt der Datenbank zeigt die HTML-Datei aber keine Bilddateien an.