HTML към текст конвертор (премахване на тагове и форматиране на редове)

Извлечете четим текст от HTML, форматирайте абзаци/списъци и премахнете script/style блоковете автоматично.

Изберете декодиране на entities и обработка на връзки, изображения и таблици, след което копирайте или изтеглете резултата в един поток.

Входът ви се обработва локално в този браузър и никога не се изпраща към сървър.

Премахнете HTML таговете и извлечете само текста

Входът и изходът се показват един до друг, така че можете да настройвате правилата за нови редове и опциите с минимално пробване.

Какво прави този инструмент

  • Премахва HTML тагове
  • Форматира новите редове за абзаци и списъци
  • Винаги изключва script/style и по желание декодира entities

Как се използва

  1. Поставете HTML (или заредете файл).
  2. При нужда коригирайте опциите за форматиране.
  3. Преобразувайте, после копирайте резултата или го запишете като .txt.

Пример

Стандартно правило

Вход (HTML)

<article><h2>Известие</h2><p>Добре дошли<br>в Finite Field</p><ul><li>Въведение</li><li>Употреба</li></ul></article>

Изход (текст)

Известие

Добре дошли
в Finite Field

- Въведение
- Употреба

Минимално правило

Вход (HTML)

<div><p>A</p><p>B</p></div>

Изход (текст)

A
B

Подробно правило

Вход (HTML)

<ol><li>Определете изискванията</li><li>Реализирайте</li></ol>

Изход (текст)

1. Определете изискванията
2. Реализирайте

Опции за форматиране

  • Превключвайте правилото за нов ред: Standard / Minimal / Detailed.
  • Изберете дали да се декодират HTML entities.
  • Настройвайте четимостта чрез свиване на интервалите и максимален брой последователни нови редове.
  • Контролирайте обработката на коментари, връзки, изображения и таблици.

Бележка: <script> и <style> винаги се изключват.

Правила за преобразуване

Елементи, преобразувани в нови редове (Standard)

  • <br>
  • <p>, заглавия (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Винаги изключвани елементи

  • <script>...</script>
  • <style>...</style>
  • При нужда можете да изключите и <noscript>.

Примери за форматиране на списъци

  • <ul><li>Елемент</li></ul> -> - Елемент
  • <ol><li>Елемент</li></ol> -> - Елемент (Стандартно/Минимално)
  • <ol><li>Елемент</li></ol> -> 1. Елемент (Подробно)

Често задавани въпроси

Новите редове изглеждат странно

Този инструмент преобразува тагове като <p>/<br>/<li> в нови редове. Настройте Line Break Rule и Max Consecutive Line Breaks, за да се доближите до желания формат.

Запазват ли се script/style блоковете?

Не. <script> и <style> винаги се премахват.

Какво става с entities като &amp; ?

Можете да изберете включено/изключено декодиране. Включете го, когато искате &amp; да стане &.

Как да намаля излишните нови редове и интервали?

Използвайте Minimal rule, оставете Collapse Spaces включено и задайте Max Consecutive Line Breaks на 1 или 2.

Мога ли да запазя URL адресите заедно с текста на връзките?

Да. Задайте Link Handling на Text + URL.

Бележки

  • Инструментът анализира входния HTML източник; не изпълнява скриптове и не възпроизвежда пълния резултат от рендирането в браузър.
  • Много големите входни данни може да изискват повече време за преобразуване.
  • Входното съдържание не се съхранява в query параметрите на URL адреса.