HTML til tekst-konverterer (fjerning av tagger og linjeformatering)

Trekk ut lesbar brødtekst fra HTML, formater avsnitt og lister, og fjern automatisk script-/style-blokker.

Velg dekoding av entiteter og håndtering av lenker, bilder og tabeller, og kopier eller last ned resultatet i én arbeidsflyt.

Inndataene dine behandles lokalt i denne nettleseren og sendes aldri til en server.

Fjern HTML-tagger og trekk ut bare tekst

Inndata og utdata vises side om side, slik at du kan justere regler for linjeskift og alternativer med minimal prøving og feiling.

Hva dette verktøyet gjør

  • Fjerner HTML-tagger
  • Formaterer linjeskift for avsnitt og lister
  • Utelukker alltid script/style og kan valgfritt dekode entiteter

Slik bruker du det

  1. Lim inn HTML (eller last inn en fil).
  2. Juster formateringsalternativene ved behov.
  3. Konverter, og kopier deretter resultatet eller lagre som .txt.

Eksempel

Standardregel

Inndata (HTML)

<article><h2>Merknad</h2><p>Velkommen<br>til Finite Field</p><ul><li>Intro</li><li>Bruk</li></ul></article>

Utdata (tekst)

Merknad

Velkommen
til Finite Field

- Intro
- Bruk

Minimal regel

Inndata (HTML)

<div><p>A</p><p>B</p></div>

Utdata (tekst)

A
B

Detaljert regel

Inndata (HTML)

<ol><li>Definer krav</li><li>Implementer</li></ol>

Utdata (tekst)

1. Definer krav
2. Implementer

Formateringsalternativer

  • Bytt regel for linjeskift: Standard / Minimal / Detaljert.
  • Velg om HTML-entiteter skal dekodes.
  • Juster lesbarheten med sammenslåing av mellomrom og maksimalt antall påfølgende linjeskift.
  • Styr håndtering av kommentarer, lenker, bilder og tabeller.

Merk: <script> og <style> er alltid utelukket.

Konverteringsregler

Elementer som konverteres til linjeskift (standard)

  • <br>
  • <p>, overskrifter (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elementer som alltid utelukkes

  • <script>...</script>
  • <style>...</style>
  • Du kan også utelukke <noscript> ved behov.

Eksempler på listeformatering

  • <ul><li>Element</li></ul> -> - Element
  • <ol><li>Element</li></ol> -> - Element (Standard/Minimal)
  • <ol><li>Item</li></ol> -> 1. Item (Detaljert)

FAQ

Linjeskiftene ser rare ut

Dette verktøyet konverterer tagger som <p>/<br>/<li> til linjeskift. Juster Regel for linjeskift og Maks påfølgende linjeskift for å komme nærmere målformatet ditt.

Beholdes script-/style-blokker?

Nei. <script> og <style> fjernes alltid.

Hva med entiteter som &amp; ?

Du kan velge dekoding av/på. Slå på dekoding når du vil at &amp; skal bli til &.

Hvordan kan jeg redusere ekstra linjeskift og mellomrom?

Bruk minimal regel, behold Sammenføy mellomrom PÅ, og sett Maks påfølgende linjeskift til 1 eller 2.

Kan jeg beholde URL-er sammen med lenketeksten?

Ja. Sett Lenkehåndtering til Tekst + URL.

Merknader

  • Verktøyet parser HTML-kilden du limer inn; det kjører ikke script eller gjenskaper full gjengivelse fra nettleseren.
  • Svært store inndata kan ta lengre tid å konvertere.
  • Innholdet du limer inn lagres ikke i URL-ens query-parametere.