HTML till text-konverterare (ta bort taggar och formatera rader)

Hamta ut lasbar brodtext fran HTML, formatera stycken och listor och ta bort script/style-block automatiskt.

Valj avkodning av entiteter och hur lankar, bilder och tabeller ska hanteras, och kopiera eller ladda ned resultatet i ett flode.

Dina indata bearbetas lokalt i denna webblasare och skickas aldrig till en server.

Ta bort HTML-taggar och extrahera bara text

Indata och utdata visas sida vid sida, sa att du kan justera regler for radbrytningar och alternativ med minimalt antal forsok.

Vad verktyget gor

  • Tar bort HTML-taggar
  • Formaterar radbrytningar for stycken och listor
  • Utesluter alltid script/style och kan valfritt avkoda entiteter

Sa anvander du den

  1. Klistra in HTML (eller lasa in en fil).
  2. Justera formateringsalternativ vid behov.
  3. Konvertera och kopiera sedan resultatet eller spara som .txt.

Exempel

Standardregel

Indata (HTML)

<article><h2>Obs</h2><p>Valkommen<br>till Finite Field</p><ul><li>Intro</li><li>Anvandning</li></ul></article>

Utdata (text)

Obs

Valkommen
till Finite Field

- Intro
- Anvandning

Minimal regel

Indata (HTML)

<div><p>A</p><p>B</p></div>

Utdata (text)

A
B

Detaljerad regel

Indata (HTML)

<ol><li>Definiera krav</li><li>Implementera</li></ol>

Utdata (text)

1. Definiera krav
2. Implementera

Formateringsalternativ

  • Byt regel for radbrytningar: Standard / Minimal / Detaljerad.
  • Valj om HTML-entiteter ska avkodas.
  • Justera lasbarheten med sammanslagning av blanksteg och max antal sammanhangande radbrytningar.
  • Styr hantering av kommentarer, lankar, bilder och tabeller.

Obs: <script> och <style> utesluts alltid.

Konverteringsregler

Element som konverteras till radbrytningar (standard)

  • <br>
  • <p>, rubriker (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Element som alltid utesluts

  • <script>...</script>
  • <style>...</style>
  • Du kan ocksa utesluta <noscript> vid behov.

Exempel pa listformattering

  • <ul><li>Post</li></ul> -> - Post
  • <ol><li>Post</li></ol> -> - Post (Standard/Minimal)
  • <ol><li>Post</li></ol> -> 1. Post (Detaljerad)

Vanliga fragor

Radbrytningarna ser konstiga ut

Verktyget konverterar taggar som <p>/<br>/<li> till radbrytningar. Justera regel for radbrytningar och max antal sammanhangande radbrytningar for att komma narmare malformatet.

Behalls script/style-block?

Nej. <script> och <style> tas alltid bort.

Hur hanteras entiteter som &amp; ?

Du kan valja av/pa. Sla pa avkodning om du vill att &amp; ska bli &.

Hur minskar jag extra radbrytningar och blanksteg?

Anvand Minimal regel, hall Sammanfoga blanksteg aktiv och satt Max sammanhangande radbrytningar till 1 eller 2.

Kan jag behalla URL:er tillsammans med lanktext?

Ja. Stall in lankhantering till Text + URL.

Obs

  • Verktyget tolkar den inmatade HTML-kallan; det kor inga script och aterger inte fullstandig renderad webblasarutdata.
  • Mycket stora indata kan ta langre tid att konvertera.
  • Indata sparas inte i URL:ens query-parametrar.