HTML-zu-Text-Konverter (Tag-Entfernung & Zeilenformatierung)

Extrahieren Sie lesbaren Fließtext aus HTML, formatieren Sie Absätze/Listen und entfernen Sie script/style-Blöcke automatisch.

Wählen Sie Entity-Dekodierung und die Behandlung von Links, Bildern und Tabellen und kopieren oder laden Sie das Ergebnis in einem Ablauf herunter.

Ihre Eingabe wird lokal in diesem Browser verarbeitet und niemals an einen Server gesendet.

HTML-Tags entfernen und nur Text extrahieren

Eingabe und Ausgabe werden nebeneinander angezeigt, sodass Sie Zeilenumbruch-Regeln und Optionen mit minimalem Ausprobieren abstimmen können.

Was dieses Werkzeug tut

  • HTML-Tags entfernen
  • Zeilenumbrüche für Absätze und Listen formatieren
  • script/style immer ausschließen und Entities optional dekodieren

So wird es verwendet

  1. HTML einfügen (oder Datei laden).
  2. Bei Bedarf Formatierungsoptionen anpassen.
  3. Konvertieren und dann das Ergebnis kopieren oder als .txt speichern.

Beispiel

Standardregel

Eingabe (HTML)

<article><h2>Hinweis</h2><p>Willkommen<br>bei Finite Field</p><ul><li>Einführung</li><li>Nutzung</li></ul></article>

Ausgabe (Text)

Hinweis

Willkommen
bei Finite Field

- Einführung
- Nutzung

Minimale Regel

Eingabe (HTML)

<div><p>A</p><p>B</p></div>

Ausgabe (Text)

A
B

Detaillierte Regel

Eingabe (HTML)

<ol><li>Anforderungen definieren</li><li>Implementieren</li></ol>

Ausgabe (Text)

1. Anforderungen definieren
2. Implementieren

Formatierungsoptionen

  • Regel für Zeilenumbrüche umschalten: Standard / Minimal / Detailliert.
  • Wählen Sie, ob HTML-Entities dekodiert werden sollen.
  • Passen Sie die Lesbarkeit mit Leerzeichen-Zusammenfassung und maximalen aufeinanderfolgenden Zeilenumbrüchen an.
  • Steuern Sie die Behandlung von Kommentaren, Links, Bildern und Tabellen.

Hinweis: <script> und <style> sind immer ausgeschlossen.

Konvertierungsregeln

Elemente, die in Zeilenumbrüche umgewandelt werden (Standard)

  • <br>
  • <p>, Überschriften (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Immer ausgeschlossene Elemente

  • <script>...</script>
  • <style>...</style>
  • Bei Bedarf kann auch <noscript> ausgeschlossen werden.

Beispiele für Listenformatierung

  • <ul><li>Eintrag</li></ul> -> - Eintrag
  • <ol><li>Eintrag</li></ol> -> - Eintrag (Standard/Minimal)
  • <ol><li>Eintrag</li></ol> -> 1. Eintrag (Detailliert)

Häufig gestellte Fragen

Zeilenumbrüche sehen merkwürdig aus

Dieses Werkzeug wandelt Tags wie <p>/<br>/<li> in Zeilenumbrüche um. Passen Sie Zeilenumbruch-Regel und maximale aufeinanderfolgende Zeilenumbrüche an, um näher an Ihr Zielformat zu kommen.

Werden script/style-Blöcke beibehalten?

Nein. <script> und <style> werden immer entfernt.

Was ist mit Entities wie &amp; ?

Sie können das Dekodieren ein- oder ausschalten. Schalten Sie es ein, wenn &amp; zu & werden soll.

Wie kann ich zusätzliche Zeilenumbrüche und Leerzeichen reduzieren?

Verwenden Sie die minimale Regel, lassen Sie „Aufeinanderfolgende Leerzeichen zusammenfassen“ aktiviert und setzen Sie maximale aufeinanderfolgende Zeilenumbrüche auf 1 oder 2.

Kann ich URLs zusammen mit Linktext beibehalten?

Ja. Setzen Sie die Link-Behandlung auf „Text + URL“.

Hinweise

  • Das Werkzeug analysiert den eingegebenen HTML-Quelltext; es führt keine Skripte aus und reproduziert keine vollständige Browser-Darstellung.
  • Sehr große Eingaben können länger in der Konvertierung dauern.
  • Eingabeinhalte werden nicht in URL-Query-Parametern gespeichert.