HTML to Text Converter (Tag Removal & Line Formatting)

Extract readable body text from HTML, format paragraphs/lists, and remove script/style blocks automatically.

Veldu afkóðun eininga og meðhöndlun tengla, mynda og taflna, afritaðu síðan eða sæktu niðurstöðuna í einu flæði.

Inntakið þitt er unnið staðbundið í þessum vafra og er aldrei sent á netþjón.

Remove HTML tags and extract only text

Inntak og úttak eru sýnd hlið við hlið svo þú getir stillt reglur fyrir línuskipti og valkosti með lágmarks tilraunum.

Það sem þetta tól gerir

  • Remove HTML tags
  • Format line breaks for paragraphs and lists
  • Always exclude script/style and optionally decode entities

How to use

  1. Paste HTML (or load a file).
  2. Adjust formatting options if needed.
  3. Umbreyttu, afritaðu síðan niðurstöðuna eða vistaðu sem .txt.

Sample

Standard rule

Inntak (HTML)

<article><h2>Tilkynning</h2><p>Velkomin<br>í Finite Field</p><ul><li>Inngangur</li><li>Notkun</li></ul></article>

Úttak (texti)

Tilkynning

Velkomin
í Finite Field

- Inngangur
- Notkun

Minimal rule

Inntak (HTML)

<div><p>A</p><p>B</p></div>

Úttak (texti)

A
B

Detailed rule

Inntak (HTML)

<ol><li>Define requirements</li><li>Implement</li></ol>

Úttak (texti)

1. Define requirements
2. Implement

Formatting options

  • Switch line-break rule: Standard / Minimal / Detailed.
  • Choose whether to decode HTML entities.
  • Tune readability with space collapsing and max consecutive line breaks.
  • Stjórnaðu meðhöndlun athugasemda, tengla, mynda og taflna.

Note: <script> and <style> are always excluded.

Conversion rules

Elements converted to line breaks (Standard)

  • <br>
  • <p>, headings (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Always excluded elements

  • <script>...</script>
  • <style>...</style>
  • You can also exclude <noscript> when needed.

List formatting examples

  • <ul><li>Item</li></ul> -> - Item
  • <ol><li>Item</li></ol> -> - Item (Standard/Minimal)
  • <ol><li>Item</li></ol> -> 1. Item (Detailed)

Algengar spurningar

Line breaks look odd

Þetta tól breytir tögum eins og <p>/<br>/<li> í línuskipti. Stilltu reglu fyrir línuskipti og hámarksfjölda samfelldra línuskipta til að nálgast markformið þitt.

Are script/style blocks kept?

No. <script> and <style> are always removed.

What about entities like &amp; ?

You can choose decode on/off. Turn decoding on when you want &amp; to become &.

How can I reduce extra line breaks and spaces?

Use Minimal rule, keep Collapse Spaces on, and set Max Consecutive Line Breaks to 1 or 2.

Can I keep URLs with link text?

Yes. Set Link Handling to Text + URL.

Athugasemdir

  • Tólið greinir frumkóða HTML inntaksins; það keyrir ekki script eða endurskapar fulla birtingu vafra.
  • Mjög stór inntök geta tekið lengri tíma í umbreytingu.
  • Inntaksefni er ekki vistað í query parameters slóðar.