HTML til tekst-konverter (fjernelse af tags og linjeformatering)

Udtræk læsbar brødtekst fra HTML, formater afsnit/lister, og fjern automatisk script/style-blokke.

Vælg afkodning af entiteter og håndtering af links, billeder og tabeller, og kopiér eller download resultatet i ét flow.

Dit input behandles lokalt i denne browser og sendes aldrig til en server.

Fjern HTML-tags og udtræk kun tekst

Input og output vises side om side, så du kan finjustere regler for linjeskift og indstillinger med minimal prøven og fejlen.

Hvad dette værktøj gør

  • Fjerner HTML-tags
  • Formaterer linjeskift for afsnit og lister
  • Udelukker altid script/style og kan valgfrit afkode entiteter

Sådan bruges det

  1. Indsæt HTML (eller indlæs en fil).
  2. Juster om nødvendigt formateringsindstillinger.
  3. Konvertér, og kopiér derefter resultatet eller gem det som .txt.

Eksempel

Standardregel

Inddata (HTML)

<article><h2>Meddelelse</h2><p>Velkommen<br>til Finite Field</p><ul><li>Introduktion</li><li>Brug</li></ul></article>

Output (tekst)

Meddelelse

Velkommen
til Finite Field

- Introduktion
- Brug

Minimal regel

Inddata (HTML)

<div><p>A</p><p>B</p></div>

Output (tekst)

A
B

Detaljeret regel

Inddata (HTML)

<ol><li>Definer krav</li><li>Implementer</li></ol>

Output (tekst)

1. Definer krav
2. Implementer

Formateringsindstillinger

  • Skift regel for linjeskift: Standard / Minimal / Detaljeret.
  • Vælg om HTML-entiteter skal afkodes.
  • Juster læsbarheden med sammenfoldning af mellemrum og maksimalt antal sammenhængende linjeskift.
  • Styr håndteringen af kommentarer, links, billeder og tabeller.

Bemærk: <script> og <style> udelukkes altid.

Konverteringsregler

Elementer, der bliver til linjeskift (standard)

  • <br>
  • <p>, overskrifter (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elementer, der altid udelukkes

  • <script>...</script>
  • <style>...</style>
  • Du kan også udelukke <noscript> efter behov.

Eksempler på listeformatering

  • <ul><li>Element</li></ul> -> - Element
  • <ol><li>Element</li></ol> -> - Element (Standard/Minimal)
  • <ol><li>Item</li></ol> -> 1. Item (Detaljeret)

Ofte stillede spørgsmål

Linjeskiftene ser mærkelige ud

Dette værktøj konverterer tags som <p>/<br>/<li> til linjeskift. Justér regel for linjeskift og maks. antal sammenhængende linjeskift for at komme tættere på dit ønskede format.

Beholdes script/style-blokke?

Nej. <script> og <style> fjernes altid.

Hvad med entiteter som &amp; ?

Du kan vælge afkodning til/fra. Slå afkodning til, når du vil have &amp; til at blive &.

Hvordan kan jeg reducere ekstra linjeskift og mellemrum?

Brug Minimal-regel, behold Sammenfold mellemrum slået til, og sæt maks. antal sammenhængende linjeskift til 1 eller 2.

Kan jeg beholde URL'er sammen med linkteksten?

Ja. Sæt håndtering af links til Tekst + URL.

Bemærkninger

  • Værktøjet parser input-HTML-kilden; det udfører ikke scripts og gengiver ikke fuldt browseroutput.
  • Meget store input kan tage længere tid at konvertere.
  • Inputindhold gemmes ikke i URL-forespørgselsparametre.