Konwerter HTML do tekstu (usuwanie tagów i formatowanie wierszy)

Wyodrębnij czytelny tekst z HTML, sformatuj akapity/listy i automatycznie usuń bloki script/style.

Wybierz dekodowanie encji oraz sposób obsługi linków, obrazów i tabel, a potem skopiuj lub pobierz wynik w jednym przebiegu.

Dane wejściowe są przetwarzane lokalnie w tej przeglądarce i nigdy nie są wysyłane na serwer.

Usuń tagi HTML i wyodrębnij sam tekst

Wejście i wyjście są pokazane obok siebie, więc możesz dopasować reguły łamania linii i opcje przy minimalnej liczbie prób.

Co robi to narzędzie

  • Usuwa tagi HTML
  • Formatuje łamanie linii dla akapitów i list
  • Zawsze wyklucza script/style i opcjonalnie dekoduje encje

Jak używać

  1. Wklej HTML (albo wczytaj plik).
  2. W razie potrzeby dostosuj opcje formatowania.
  3. Konwertuj, a następnie skopiuj wynik albo zapisz go jako .txt.

Przykład

Reguła standardowa

Wejście (HTML)

<article><h2>Ogłoszenie</h2><p>Witamy<br>w Finite Field</p><ul><li>Wstęp</li><li>Użycie</li></ul></article>

Wyjście (tekst)

Ogłoszenie

Witamy
w Finite Field

- Wstęp
- Użycie

Reguła minimalna

Wejście (HTML)

<div><p>A</p><p>B</p></div>

Wyjście (tekst)

A
B

Reguła szczegółowa

Wejście (HTML)

<ol><li>Określ wymagania</li><li>Wdrożenie</li></ol>

Wyjście (tekst)

1. Określ wymagania
2. Wdrożenie

Opcje formatowania

  • Przełącz regułę łamania linii: Standardowa / Minimalna / Szczegółowa.
  • Wybierz, czy dekodować encje HTML.
  • Popraw czytelność przez scalanie spacji i ograniczenie maksymalnej liczby kolejnych pustych linii.
  • Steruj obsługą komentarzy, linków, obrazów i tabel.

Uwaga: <script> i <style> są zawsze wykluczane.

Reguły konwersji

Elementy zamieniane na podziały linii (standard)

  • <br>
  • <p>, nagłówki (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elementy zawsze wykluczane

  • <script>...</script>
  • <style>...</style>
  • W razie potrzeby możesz też wykluczyć <noscript>.

Przykłady formatowania list

  • <ul><li>Pozycja</li></ul> -> - Pozycja
  • <ol><li>Pozycja</li></ol> -> - Pozycja (standard/minimalna)
  • <ol><li>Pozycja</li></ol> -> 1. Pozycja (szczegółowa)

FAQ

Łamanie linii wygląda dziwnie

To narzędzie zamienia tagi takie jak <p>/<br>/<li> na podziały linii. Dopasuj regułę łamania linii i maksymalną liczbę kolejnych pustych linii, aby zbliżyć wynik do oczekiwanego formatu.

Czy bloki script/style są zachowywane?

Nie. <script> i <style> są zawsze usuwane.

Co z encjami typu &amp; ?

Możesz włączyć albo wyłączyć dekodowanie. Włącz je, jeśli chcesz, aby &amp; zostało zamienione na &.

Jak ograniczyć nadmiar pustych linii i spacji?

Użyj reguły minimalnej, pozostaw włączone scalanie spacji i ustaw maksymalną liczbę kolejnych pustych linii na 1 albo 2.

Czy mogę zachować adresy URL razem z tekstem linku?

Tak. Ustaw obsługę linków na Tekst + URL.

Uwagi

  • Narzędzie analizuje źródłowy HTML; nie uruchamia skryptów ani nie odtwarza pełnego renderowania przeglądarki.
  • Bardzo duże dane wejściowe mogą wymagać więcej czasu na konwersję.
  • Treść wejściowa nie jest zapisywana w parametrach URL.