Webarchive aktualisieren

Aus einem speziellen Forum habe ich einige Beitrag in Devonthink abgespeichert.

Teilweise werden nun noch neue Beiträge dazu gepostet, daher würde ich gerne das Webarchiv aktualisieren. Geht das?
Die URL ist ja mit abgespeichert…es müsste halt nur neu geladen werden…

Ich könnte natürlich das alte Archiv lösen und neu importieren, ist aber nen bissel umständlich …

Das geht bereits über den Kontextmenü-Befehl “Erfasstes Archiv aktualisieren”, z.B. nach Öffnen des Webarchivs in einem eigenen Fenster oder Darstellen des Webarchivs in der zwei/dreigeteilten Ansicht.

aaaah super :smiley:

das hatte ich noch nicht entdeckt :wink:

Mich interessiert das ebenfalls. Wenn ich allerdings eine Webseite per Devonthink-Downloadmanager als komplettes Webarchiv geladen habe, finde ich den genannten Kontextmenü-Befehl nicht. Es stehen dann im Download-Ordner die einzelnen Ordner der Website. An welcher Stelle genau bekomme ich diesen Befehl im Kontextmenü?

Würde mich über einen Hinweis sehr freuen - vielleicht mit Screenshot?

Der Download-Manager erzeugt keine .webarchive-Dateien, sondern lädt alle Resourcen einzeln herunter und fügt sie zur Download-Gruppe hinzu. Für die Downloads existiert aber (noch) keine Aktualisierungsfunktion.

Existiert mittlerweile für die Downloads eine Aktualisierungsfunktion? Falls nicht, gibt es eine Möglichkeit, wie ich mittels dem Download-Manager importierte Webseiten automatisch auf Aktualisierungen/Updates überprüfe?

Grüße

Ich würde das mit curl oder wget o.ä. im Terminal oder als cron-Job machen.

1 Like

Hi, danke für die schnelle Antwort. Würde es denn mit DEVONagent Pro gehen? Beispiel: Ich möchte eine bestimmte Webseite einmal pro Woche komplett durchforsten und alle PDF-Dokument herunterladen bzw. in DEVONthink importieren, damit ich diese schnell durchsuchen kann. Neue Dokumente sollte hinzugefügt und alte/bestehende Dokumente ersetzt v. Optimal wäre es, wenn neue und überarbeitete Dokumente markiert würden, z.B. als ungelesen.

Alternativ: Wie kann ich DEVONagent PRO konfigurieren, dass die PDF-Dokumente in der o.g. Seite nach einem Suchbegriff durchsucht werden?

Grüße

Ich habe keine Ahnung von DEVONAgent. Aber da du offensichtlich eine Website (!) spiegeln willst, würde ich dafür Software benutzen, die ausdrücklich dafür gemacht ist (eben wget/curl in Verbindung mit cron). Und dann die Dateien in DT nicht importieren, sondern den jeweiligen Ordner indizieren.

Aber was sind das für PDFs, die sich wöchentlich ändern?

Es geht um öffentlich zugängliche Gesetze die ich auf Änderungen hin überprüfen möchte. Ich suche nach einer Möglichkeit automatisiert in Erfahrung zu bringen, wenn sich Gesetze ändern. Ich dachte das wäre in DT möglich. Ich habe nun einige URLs zu wichtigen Gesetzen in DT hinzugefügt (Ziel ist jeweils eine HTML oder PDF-Datei). Aber so wie es aussieht aktualisiert sich das in DT hinterlegte PDF bzw. die in DT hinterlegte Webseite trotz hinterlegter URL nicht von alleine, sobald eine neuere Version auf dem Server verfügbar ist. Habe ich da etwas verkehrt gemacht?

Nein, da hast du sicherlich nichts verkehrt gemacht – DT verspricht ja nicht, heruntergeladene Dateien zu aktualisieren. Das ist mit vernünftigem(!) Aufwand auch nicht zu bewerkstelligen. Und es wird auch alle diejenigen stören, die eben die Dateien in einem bestimmten Zustand haben wollen.

Gesetze ändern sich ja nicht einfach so, sondern nur, wenn der Bundestag sie ändert. Ich würde also in erster Linie das Bundesgesetzblatt betrachten. Und da die aktuelle Version aller Gesetze ja ohnehin immer (!) online verfügbar ist, braucht man sie eigentlich auch nicht herunterzuladen.

Mir ist zwar nicht so ganz klar, warum man das verfolgen will, aber es gibt vom Justizministerium eine Seite (Gesetze im Internet - Aktualitätendienst) mit allen Änderungen im Bundesgesetzblatt, und dort auch die Möglichkeit, diese als RSS-Feed zu abonnieren.
Ähnliches gibt es auch für viele Bundesländer…