HTML to Text փոխարկիչ (tag-երի հեռացում և տողերի ձևաչափում)

HTML-ից արտածիր ընթեռնելի հիմնական տեքստը, ձևաչափիր պարբերություններն ու ցուցակները և ավտոմատ հեռացրու script/style block-երը։

Ընտրիր entity decode-ը և հղումների, պատկերների ու աղյուսակների մշակումը, ապա պատճենիր կամ ներբեռնի՛ր արդյունքը մեկ հոսքով։

Քո մուտքը մշակվում է տեղային՝ այս բրաուզերում և երբեք չի ուղարկվում սերվերի։

Հեռացրու HTML tag-երը և արտածիր միայն տեքստը

Մուտքն ու արդյունքը ցուցադրվում են կողք կողքի, այնպես որ կարող ես line break կանոններն ու ընտրանքները հարմարեցնել նվազագույն փորձարկումներով։

Ինչ է անում այս գործիքը

  • Հեռացնում է HTML tag-երը
  • Ձևաչափում է պարբերությունների և ցուցակների line break-երը
  • Միշտ բացառում է script/style-ը և ընտրովի decode է անում entity-ները

Ինչպես օգտագործել

  1. Տեղադրիր HTML-ը (կամ բեռնիր ֆայլ)։
  2. Անհրաժեշտության դեպքում կարգավորիր ձևաչափման ընտրանքները։
  3. Փոխարկիր, հետո պատճենիր արդյունքը կամ պահպանի՛ր որպես .txt։

Օրինակ

Ստանդարտ կանոն

Մուտք (HTML)

<article><h2>Ծանուցում</h2><p>Բարի գալուստ<br>Finite Field</p><ul><li>Ներածություն</li><li>Օգտագործում</li></ul></article>

Արդյունք (տեքստ)

Ծանուցում

Բարի գալուստ
Finite Field

- Ներածություն
- Օգտագործում

Նվազագույն կանոն

Մուտք (HTML)

<div><p>A</p><p>B</p></div>

Արդյունք (տեքստ)

A
B

Մանրամասն կանոն

Մուտք (HTML)

<ol><li>Սահմանել պահանջները</li><li>Իրականացնել</li></ol>

Արդյունք (տեքստ)

1. Սահմանել պահանջները
2. Իրականացնել

Ձևաչափման ընտրանքներ

  • Փոխիր line-break կանոնը՝ Standard / Minimal / Detailed։
  • Ընտրիր՝ decode անել HTML entity-ները, թե ոչ։
  • Կարգավորիր ընթեռնելիությունը space collapsing-ի և line break-երի առավելագույն քանակի միջոցով։
  • Վերահսկիր comment-ների, հղումների, պատկերների և աղյուսակների մշակումը։

Նշում․ <script>-ն ու <style>-ը միշտ բացառվում են։

Փոխարկման կանոններ

Line break դարձող տարրեր (Standard)

  • <br>
  • <p>, վերնագրեր (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Միշտ բացառվող տարրեր

  • <script>...</script>
  • <style>...</style>
  • Անհրաժեշտության դեպքում կարող ես նաև բացառել <noscript>-ը։

Ցուցակների ձևաչափման օրինակներ

  • <ul><li>Տարր</li></ul> -> - Տարր
  • <ol><li>Տարր</li></ol> -> - Տարր (Ստանդարտ/Նվազագույն)
  • <ol><li>Տարր</li></ol> -> 1. Տարր (Մանրամասն)

ՀՏՀ

Line break-երը տարօրինակ են երևում

Այս գործիքը <p>/<br>/<li> նման tag-երը փոխարկում է line break-երի։ Փոխիր Line Break Rule-ը և Max Consecutive Line Breaks-ը՝ քո նպատակային ձևաչափին ավելի մոտ արդյունք ստանալու համար։

script/style block-երը պահպանվու՞մ են։

Ոչ։ <script>-ն ու <style>-ը միշտ հեռացվում են։

Ի՞նչ է լինում &amp; նման entity-ների հետ։

Դու կարող ես decode-ը միացնել կամ անջատել։ Եթե ուզում ես, որ &amp;-ը դառնա &, միացրու decode-ը։

Ինչպե՞ս կրճատեմ ավելորդ line break-երն ու բացատները։

Օգտագործիր Minimal կանոնը, միացված պահիր Collapse Spaces-ը և Max Consecutive Line Breaks-ը դիր 1 կամ 2։

Կարո՞ղ եմ պահել URL-ները link text-ի հետ միասին։

Այո։ Link Handling-ը դիր Text + URL։

Նշումներ

  • Գործիքը parse է անում մուտքային HTML source-ը․ այն չի գործարկում script-եր և չի վերարտադրում բրաուզերի ամբողջ render արդյունքը։
  • Շատ մեծ մուտքերը կարող են ավելի երկար փոխարկվել։
  • Մուտքային բովանդակությունը URL query parameter-ներում չի պահպանվում։