HTML uz teksta pārveidotājs (tagu noņemšana un rindu formatēšana)

Izgūstiet lasāmu pamattekstu no HTML, formatējiet rindkopas/sarakstus un automātiski noņemiet script/style blokus.

Izvēlieties entity dekodēšanu un saišu, attēlu un tabulu apstrādi, pēc tam vienā plūsmā kopējiet vai lejupielādējiet rezultātu.

Jūsu ievade tiek apstrādāta lokāli šajā pārlūkā un nekad netiek sūtīta uz serveri.

Noņemiet HTML tagus un iegūstiet tikai tekstu

Ievade un izvade tiek rādītas blakus, tāpēc varat pielāgot rindu pārtraukumu noteikumus un opcijas ar minimālu mēģinājumu skaitu.

Ko dara šis rīks

  • Noņem HTML tagus
  • Formatē rindu pārtraukumus rindkopām un sarakstiem
  • Vienmēr izslēdz script/style un pēc izvēles dekodē entities

Kā lietot

  1. Ielīmējiet HTML (vai ielādējiet failu).
  2. Ja vajag, pielāgojiet formatēšanas opcijas.
  3. Pārveidojiet, pēc tam nokopējiet rezultātu vai saglabājiet kā .txt.

Paraugs

Standarta noteikums

Ievade (HTML)

<article><h2>Paziņojums</h2><p>Laipni lūdzam<br>Finite Field</p><ul><li>Ievads</li><li>Lietošana</li></ul></article>

Izvade (teksts)

Paziņojums

Laipni lūdzam
Finite Field

- Ievads
- Lietošana

Minimālais noteikums

Ievade (HTML)

<div><p>A</p><p>B</p></div>

Izvade (teksts)

A
B

Detalizētais noteikums

Ievade (HTML)

<ol><li>Definēt prasības</li><li>Ieviest</li></ol>

Izvade (teksts)

1. Definēt prasības
2. Ieviest

Formatēšanas opcijas

  • Pārslēdziet rindu pārtraukumu noteikumu: Standarta / Minimāls / Detalizēts.
  • Izvēlieties, vai dekodēt HTML entities.
  • Pielāgojiet lasāmību ar atstarpju sapludināšanu un maksimālo secīgo rindu pārtraukumu skaitu.
  • Kontrolējiet komentāru, saišu, attēlu un tabulu apstrādi.

Piezīme: <script> un <style> vienmēr tiek izslēgti.

Pārveidošanas noteikumi

Elementi, kas tiek pārvērsti rindu pārtraukumos (Standarta)

  • <br>
  • <p>, virsraksti (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Vienmēr izslēgtie elementi

  • <script>...</script>
  • <style>...</style>
  • Ja vajag, varat izslēgt arī <noscript>.

Sarakstu formatēšanas piemēri

  • <ul><li>Vienums</li></ul> -> - Vienums
  • <ol><li>Vienums</li></ol> -> - Vienums (Standarta/Minimāls)
  • <ol><li>Vienums</li></ol> -> 1. Vienums (Detalizēts)

BUJ

Rindu pārtraukumi izskatās dīvaini

Šis rīks pārvērš tādus tagus kā <p>/<br>/<li> rindu pārtraukumos. Pielāgojiet Rindu pārtraukumu noteikumu un Maksimālo secīgo rindu pārtraukumu skaitu, lai pietuvotos vēlamajam formātam.

Vai script/style bloki tiek saglabāti?

Nē. <script> un <style> vienmēr tiek noņemti.

Kā ar entities, piemēram, &amp; ?

Varat izvēlēties dekodēšanu ieslēgt vai izslēgt. Ieslēdziet dekodēšanu, ja vēlaties, lai &amp; kļūtu par &.

Kā samazināt liekos rindu pārtraukumus un atstarpes?

Izmantojiet Minimālo noteikumu, paturiet Atkārtotu atstarpju sapludināšanu ieslēgtu un iestatiet Maksimālos secīgos rindu pārtraukumus uz 1 vai 2.

Vai varu saglabāt URL kopā ar saites tekstu?

Jā. Saites apstrādē izvēlieties Teksts + URL.

Piezīmes

  • Rīks parsē ievadīto HTML avotu; tas neizpilda skriptus un neatkārto pilnu pārlūka atveidi.
  • Ļoti liela ievade var prasīt vairāk laika pārveidošanai.
  • Ievades saturs netiek glabāts URL query parametros.