Канвертар HTML у тэкст (выдаленне тэгаў і фарматаванне радкоў)

Выцягвайце з HTML чытэльны тэкст, фарматуйце абзацы і спісы, а таксама аўтаматычна выдаляйце блокі script/style.

Выбірайце дэкадаванне entities і спосаб апрацоўкі спасылак, выяў і табліц, а затым капіруйце або спампоўвайце вынік у адным патоку.

Увод апрацоўваецца лакальна ў гэтым браўзеры і ніколі не адпраўляецца на сервер.

Выдаліце HTML-тэгі і пакіньце толькі тэкст

Увод і вынік паказваюцца побач, таму можна наладжваць правілы пераносаў і параметры з мінімумам спроб і памылак.

Што робіць гэты інструмент

  • Выдаляе HTML-тэгі
  • Фарматуе пераносы радкоў для абзацаў і спісаў
  • Заўсёды выключае script/style і пры неабходнасці дэкадуе entities

Як карыстацца

  1. Устаўце HTML (або загрузіце файл).
  2. Пры неабходнасці адкарэктуйце параметры фарматавання.
  3. Націсніце Convert, затым скапіруйце вынік або захавайце яго як .txt.

Прыклад

Стандартнае правіла

Увод (HTML)

<article><h2>Абвестка</h2><p>Сардэчна запрашаем<br>у Finite Field</p><ul><li>Уводзіны</li><li>Выкарыстанне</li></ul></article>

Вынік (тэкст)

Абвестка

Сардэчна запрашаем
у Finite Field

- Уводзіны
- Выкарыстанне

Мінімальнае правіла

Увод (HTML)

<div><p>A</p><p>B</p></div>

Вынік (тэкст)

A
B

Падрабязнае правіла

Увод (HTML)

<ol><li>Вызначыць патрабаванні</li><li>Рэалізаваць</li></ol>

Вынік (тэкст)

1. Вызначыць патрабаванні
2. Рэалізаваць

Параметры фарматавання

  • Пераключайце правіла пераносаў: Standard / Minimal / Detailed.
  • Выбірайце, ці трэба дэкадаваць HTML entities.
  • Наладжвайце чытэльнасць праз згортванне прабелаў і абмежаванне паслядоўных пераносаў радкоў.
  • Кіруйце апрацоўкай каментарыяў, спасылак, выяў і табліц.

Заўвага: <script> і <style> заўсёды выключаюцца.

Правілы пераўтварэння

Элементы, якія ператвараюцца ў пераносы радкоў (Standard)

  • <br>
  • <p>, загалоўкі (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Элементы, якія заўсёды выключаюцца

  • <script>...</script>
  • <style>...</style>
  • Пры неабходнасці можна таксама выключыць <noscript>.

Прыклады фарматавання спісаў

  • <ul><li>Элемент</li></ul> -> - Элемент
  • <ol><li>Элемент</li></ol> -> - Элемент (Standard/Minimal)
  • <ol><li>Элемент</li></ol> -> 1. Элемент (Detailed)

Пытанні і адказы

Пераносы радкоў выглядаюць дзіўна

Гэты інструмент пераўтварае тэгі накшталт <p>/<br>/<li> у пераносы радкоў. Змяняйце Line Break Rule і Max Consecutive Line Breaks, каб наблізіцца да патрэбнага вам фармату.

Ці захоўваюцца блокі script/style?

Не. <script> і <style> заўсёды выдаляюцца.

Што будзе з entities накшталт &amp; ?

Дэкадаванне можна ўключыць або выключыць. Уключыце яго, калі хочаце, каб &amp; ператварыўся ў &.

Як зменшыць лішнія пераносы радкоў і прабелы?

Выкарыстоўвайце Minimal, пакідайце Collapse Spaces уключаным і задавайце Max Consecutive Line Breaks як 1 або 2.

Ці магу я пакінуць URL разам з тэкстам спасылкі?

Так. Усталюйце Link Handling у рэжым Text + URL.

Заўвагі

  • Інструмент разбірае зыходны HTML-код; ён не выконвае script і не імкнецца дакладна паўтарыць поўны рэндэрынг браўзера.
  • Вельмі вялікія ўводныя даныя могуць апрацоўвацца даўжэй.
  • Уведзены кантэнт не захоўваецца ў query parameters URL.