Convertor HTML in text (eliminare taguri si formatare linii)

Extrage text lizibil din HTML, formateaza paragrafe/liste si elimina automat blocurile script/style.

Alege decodificarea entitatilor si modul de tratare pentru linkuri, imagini si tabele, apoi copiaza sau descarca rezultatul intr-un singur flux.

Intrarea ta este procesata local in acest browser si nu este niciodata trimisa catre un server.

Elimina tagurile HTML si extrage doar textul

Intrarea si iesirea sunt afisate una langa alta, astfel incat poti ajusta regulile de intrerupere a liniilor si optiunile cu incercari minime.

Ce face acest instrument

  • Elimina tagurile HTML
  • Formateaza liniile noi pentru paragrafe si liste
  • Exclude mereu script/style si poate decodifica optional entitatile

Cum se foloseste

  1. Lipeste HTML (sau incarca un fisier).
  2. Ajusteaza optiunile de formatare daca este necesar.
  3. Converteste, apoi copiaza rezultatul sau salveaza-l ca .txt.

Exemplu

Regula standard

Intrare (HTML)

<article><h2>Notificare</h2><p>Bun venit<br>la Finite Field</p><ul><li>Introducere</li><li>Utilizare</li></ul></article>

Iesire (Text)

Notificare

Bun venit
la Finite Field

- Introducere
- Utilizare

Regula minima

Intrare (HTML)

<div><p>A</p><p>B</p></div>

Iesire (Text)

A
B

Regula detaliata

Intrare (HTML)

<ol><li>Defineste cerintele</li><li>Implementeaza</li></ol>

Iesire (Text)

1. Defineste cerintele
2. Implementeaza

Optiuni de formatare

  • Comuta regula de intrerupere a liniilor: Standard / Minimal / Detaliat.
  • Alege daca vrei sa decodezi entitatile HTML.
  • Ajusteaza lizibilitatea prin comprimarea spatiilor si limita maxima de linii goale consecutive.
  • Controleaza modul de tratare a comentariilor, linkurilor, imaginilor si tabelelor.

Nota: <script> si <style> sunt excluse intotdeauna.

Reguli de conversie

Elemente convertite in intreruperi de linie (Standard)

  • <br>
  • <p>, titluri (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elemente excluse intotdeauna

  • <script>...</script>
  • <style>...</style>
  • Poti exclude si <noscript> cand este necesar.

Exemple de formatare a listelor

  • <ul><li>Element</li></ul> -> - Element
  • <ol><li>Element</li></ol> -> - Element (Standard/Minimal)
  • <ol><li>Item</li></ol> -> 1. Item (Detaliat)

Intrebari frecvente

Intreruperile de linie arata ciudat

Acest instrument converteste taguri precum <p>/<br>/<li> in intreruperi de linie. Ajusteaza Line Break Rule si Max Consecutive Line Breaks pentru a te apropia de formatul dorit.

Blocurile script/style sunt pastrate?

Nu. <script> si <style> sunt eliminate intotdeauna.

Ce se intampla cu entitati precum &amp; ?

Poti alege decodificare pornita/oprita. Activeaza decodificarea cand vrei ca &amp; sa devina &.

Cum pot reduce liniile goale si spatiile suplimentare?

Foloseste regula Minimal, pastreaza Collapse Spaces pornit si seteaza Max Consecutive Line Breaks la 1 sau 2.

Pot pastra URL-urile impreuna cu textul linkului?

Da. Seteaza Link Handling la Text + URL.

Note

  • Instrumentul parseaza sursa HTML introdusa; nu executa scripturi si nu reproduce iesirea completa de randare a browserului.
  • Intrarile foarte mari pot necesita mai mult timp pentru conversie.
  • Continutul introdus nu este stocat in parametrii query ai URL-ului.