Generelle Frage zur Archivierung von Websites

Einen schönen guten Abend,

ich bin gerade dabei mich in ein komplexes Themengebiet mittel/langfristig einzuarbeiten respektive zu recherchieren und mir eine Wissensdatenbank dazu anzulegen. Zur Archivierung der Dokumente möchte ich gerne DT verwenden.

An dieser Stelle ein grundlegende Frage, wie am besten mit Websites zu verfahren ist. Es gibt ja verschiedenste Möglichkeiten, sie zu speichern. Von reinen Lesezeichen, über Markdown, Webarchiven hin zu PDFs.

Aus dem Bauch heraus würde ich da nun grundsätzlich dazu tendieren, themenrelevante Website grundsätzlich als Lesezeichen abzusichern (DT in diesem Fall also als Bookmarking-Dienst) und spezifische einzelne Artikel als PDF zu speichern um zu vermeiden, dass sie irgendwann nicht mehr online verfügbar sind. PDF hätte für mich en Vorteil, dass ich vielfältige Kommentier/Markierungs-Optionen hätte, auch gerade in externen Programmen.

In einem Handbuch zu DT dass ich gerade zur Einarbeitung lese wird dort PDF aber nur als Spezial- und Gelegenheitslösung erwähnt. Besser als Markdown oder Webarchiv. Begründet wird es allerdings nicht.

Ich stelle mir nun die Frage: Welche Vorteile hätten diese beiden Archivierungsoptionen gegenüber dem PDF? Meine Fantasie reicht da nicht ganz aus.

Wie sichert ihr Informationen, die aus einer Internetquelle stammen?
Statische Archive haben ja wiederum den Nachteil, dass eventuelle, online erfolgte, Korrekturen am Dokument von DT nicht mitgenommen werden.

Vielen lieben Dank!

Ein längerer Vergleich dazu hier

Lesezeichen sind eher eine mittelgute Möglichkeit: kein Archiv, sondern nur der jeweils aktuelle Stand. Ändert sich die Struktur der Website, zeigt dass Lesezeichen uU ins Leere.

1 Like

Deine Frage lässt sich so nicht pauschal beantworten. Ich nutze je nach Bedarf und auch je nach Webseite alle möglichen Formate.

Das meiste, was ich sammele, sammele ich aber tatsächlich als „aufgeräumtes“ Markdown-Dokument, weil es mir auf die Texte ankommt und ich mir bewusst bin, dass Bilder entweder schon beim Speichern nicht mitgenommen werden oder ggfs. später nicht mehr darstellbar sind. Leider gibt es viele Webinhalte, die sich auf diese Weise (oder auch als unaufgeräumtes Markdown) nicht speichern lassen.

Webarchiv nehme ich auch, wenn es mir darauf ankommt, dass die Seite weitergehend so gespeichert wird, wie ich sie gesehen habe. Hat den Vorteil, dass man die Seite irgendwann aktualisieren kann, aber den Nachteil, dass viel Zeug mitgenommen wird, was nicht gebraucht wird. „Aufgeräumt“ ist hier möglich, produziert aber oft unerwartete Ergebnisse.

PDF nehme ich, wenn ich die Seite so speichern will, wenn das gespeicherte Dokument so aussehen soll, wie wenn ich es ausdrucken würde. Das produziert ein nicht mehr bearbeitbares Dokument, das teilweise recht sperrig im weiteren Handling sein kann, aber das kommt auf deinen Bedarf an.

Teilweise (z.B um irgendetwas in einem Streitfall belegen zu können) nutze ich auch Screenshots (die man anschließend lesbar und durchsuchbar machen kann).

Lesezeichen sind halt Lesezeichen wie in jedem anderen Browser auch. Irgendwann gibt es das Ziel des Lesezeichens nicht mehr oder du findest völlig andere Inhalte. Der Vorteil einer Lesezeichenverwaltung mit DT liegt darin, dass du an keinen bestimmten Browser gebunden bist und dass du deine Lesezeichen mit Metainformationen und Notizen versehen kannst.

Etwas problematisch können Seiten sein, bei denen du erst Zugangsdaten eingeben musst oder Seiten, bei denen sich irgendwelche Fenster („abonniere meinen Newsletter“ etc) drüber schieben.

Grundsätzlich gibt es keine durchgehend für alle Bedürfnisse passende Lösung, du wirst experimentieren müssen und schauen, was zu deinem Bedarf und zu deinen Anforderungen passt. Mitunter macht es auch Sinn, gefundene Informationen in mehreren Formaten abzuspeichern.

2 Likes

Danke euch für die Antworten. Den verlinkten Artikel habe ich mir mal angesehen. Grundsätzlich werde ich vermutlich einerseits “normale” Bookmarks setzen um interessante Sites zu sichern und dann Artikel, die ich besonders wichtig/interessant finde als PDF absichern. Klar, PDF hat seine Macken gegenüber Markdown, aber ich finde es plattformübergreifend am besten zu markieren/kommentieren.

Schade nur dass Evernote da den deutlich besseren Webclipper hat. Den von DT finde ich recht willkürlich, was das Ergebnis betrifft. Vielleicht bekomme ich ja eine (halb)automatisierte Sache hin. Clip in Evernote → Export als PDF → Import in DT.

Lieben Gruß

Wegen des Clippers, da kann ich das Addon MarkDownload von death.au empfehlen. Bisher konnte dieses Addon immer wenn Devonthink’s Clipper versagte, den von mir gewünschten Inhalt extrahieren. Würde die Markdown-Datei in ein Smart Folder herunterladen, damit Devonthink es ohne Klickumwege importiert. Vielleicht können die Devonthink-Entwickler ja etwas abkupfern: GitHub - deathau/markdownload: A Firefox and Google Chrome extension to clip websites and download them into a readable markdown file.

1 Like