Devonthink zur Archivierung einsetzen!?

capitano · July 17, 2021, 8:32pm

Ich würde gerne DT dazu einsetzen Feeds (Podcasts, PDFs etc.) aus den unterschiedlichsten Quellen möglichst automatisch in eine beleibige Datenbank zu archivieren.

Z.B. soll ein “abonnierter” RSS-Feed eines Podcasts bei jedem Programmstart von DT nach einer neuen Folgedurchsucht werden und diese dann automatisch runtergeladen und in eine von mir definierte Datenbank geschoben werden.

Habt ihr eine Idee wie ich das mit DT realisieren kann? Ich habe bis jetzt diverse RSS-Feeds abonniert und er zeigt mir auch die neuen Folgen an, ich finde aber keinen Weg die verlinkten Mediendateien automatisch runterzuladen. Gleiches gilt für RSS-Feeds/Webseiten die PDFs bereitstellen.

chrillek · July 18, 2021, 9:03am

Das dürfte nur mit einem Script gehen. Ob allerdings die damit verbundenen Schwierigkeiten den Aufwand lohnen?

RSS ist idR XML, das muss man parsen, was nicht lustig ist.
Dabei musst Du die Dich interessierenden Teile herausfinden, was auch nicht lustig sein dürfte, zumal für verschiedene Feeds
Dann musst Du herausfinden, ob Du den neuesten Podcast schon heruntergeladen hast oder nicht
Wenn nicht, musst Du ihn herunterladen.

Wollte ich das machen, würde ich das meiste davon außerhalb von DT erledigen, mit einer Programmiersprache, die XML und HTML parsen kann, und nur die Frage “hab ich das schon” von DT beantworten lassen. Wenn nicht, dann eben die Datei in DT schieben.

Blanc · July 18, 2021, 11:41am

Wie wäre denn da dein approach? Diese Frage hat sich mir schon öfter gestellt, und ich habe gedanklich keine simple Automatik erstellen können. Mit einer Regel in den entsprechenden Ordner verschieben und dann Status als Duplikat prüfen und wenn Duplikat, dann löschen…? Alles gescriptet, oder siehst du einen Weg innerhalb einer intelligenten Regel?

chrillek · July 18, 2021, 12:29pm

Zwei Möglichkeiten:

man importiert nicht in DT, sondern indiziert: dann würde ich das Dateisystem fragen (Name, Erstellungsdatum, so was)
man importiert: dann würde ich in DT per Script (osa... ) nach der URL suchen oder nach dem Titel oder nach irgendwas anderem, das eindeutig ist. Zur Not ein Hashwert über Metadaten oder über die Datei selbst.

Meintest du sowas?

capitano · July 18, 2021, 6:44pm

Okay, vielen Dank für die ausführliche Erklärung. Dann werde ich wohl mal schauen, wie ich die Mediendateien “außerhalb” von DT in abonniere bzw. in ein Verzeichnis meiner Wahl speichere, auf das DT dann wiederum ein Auge hat

Blanc · July 18, 2021, 8:17pm

Tatsächlich bin ich das vielleicht zu kompliziert angegangen; ich hatte überlegt DTs Duplikaterkennung irgendwie zu benutzen. Aber wahrscheinlich würde ein einziges Merkmal wie Titel oder URL völlig ausreichen. Danke; ich spiele die Tage mal.