Markdown funktioniert oft nicht

Warum bekomme ich manche Webseiten partout nicht als Markdown abgespeichert? Weder in der aufgeräumten Ansicht noch in der normalen.

Beispiel hier:

aerzteblatt.de/archiv/11806 … -und-Neues

Abgespeichert wird dies:

[www.aerzteblatt.de](https://www.aerzteblatt.de/archiv/118068/Vorhofflimmern-Gesichertes-und-Neues "Vorhofflimmern – Gesichertes und Neues")

# Vorhofflimmern – Gesichertes und Neues

Entweder ich arbeite umständlich nach oder ich nehme ein anderes Format (PDF etc.). Ich würde aber gerne bei Markdown bleiben

Das Extrahieren von Text aus Webseiten ist leider kein leichtes Unterfangen: Jede Seite ist anders aufgebaut und so kann es passieren, wie in diesem Fall, dass unser Decluttering-Dienst — aus seiner Sicht — keinen verwertbaren Text findet. Wir schauen uns das aber selbstverständlich gerne an, sobald wir wieder an unserem Dienst arbeiten.

Wir haben das Problem mit der Seite des Ärzteblatts nun nachvollzogen: Die Seite verwendet ein inkorrektes Encoding, welches unseren Decluttering-Dienst aus der Bahn geworfen hat. Wir ignorieren nun illegale Zeichen und die Konvertierung funktioniert nun bei der von Ihnen angebenen Seite.

Das ist gut. Jetzt gibt es doch deutlich weniger Probleme