HTML į tekstą keitiklis (žymų šalinimas ir eilučių formatavimas)

Iš HTML ištraukite skaitomą pagrindinį tekstą, suformatuokite pastraipas / sąrašus ir automatiškai pašalinkite script/style blokus.

Pasirinkite entitetų dekodavimą ir nuorodų, vaizdų bei lentelių tvarkymą, tada vienoje eigoje nukopijuokite arba atsisiųskite rezultatą.

Jūsų įvestis apdorojama vietoje šioje naršyklėje ir niekada nesiunčiama į serverį.

Pašalinkite HTML žymas ir ištraukite tik tekstą

Įvestis ir išvestis rodomos greta, todėl galite tiksliai derinti eilučių lūžių taisykles ir parinktis su minimaliu bandymų skaičiumi.

Ką daro šis įrankis

  • Pašalina HTML žymas
  • Formatuoja eilučių lūžius pastraipoms ir sąrašams
  • Visada pašalina script/style ir pasirinktinai dekoduoja entitetus

Kaip naudoti

  1. Įklijuokite HTML (arba įkelkite failą).
  2. Jei reikia, pakoreguokite formatavimo parinktis.
  3. Konvertuokite, tada nukopijuokite rezultatą arba išsaugokite kaip .txt.

Pavyzdys

Standartinė taisyklė

Įvestis (HTML)

<article><h2>Pranešimas</h2><p>Sveiki atvykę<br>į Finite Field</p><ul><li>Įvadas</li><li>Naudojimas</li></ul></article>

Išvestis (tekstas)

Pranešimas

Sveiki atvykę
į Finite Field

- Įvadas
- Naudojimas

Minimali taisyklė

Įvestis (HTML)

<div><p>A</p><p>B</p></div>

Išvestis (tekstas)

A
B

Detali taisyklė

Įvestis (HTML)

<ol><li>Apibrėžti reikalavimus</li><li>Įgyvendinti</li></ol>

Išvestis (tekstas)

1. Apibrėžti reikalavimus
2. Įgyvendinti

Formatavimo parinktys

  • Perjunkite eilučių lūžių taisyklę: Standard / Minimal / Detailed.
  • Pasirinkite, ar dekoduoti HTML entitetus.
  • Pagerinkite skaitomumą su tarpų sutraukimu ir maksimaliu nuoseklių eilučių lūžių skaičiumi.
  • Valdykite komentarų, nuorodų, vaizdų ir lentelių tvarkymą.

Pastaba: <script> ir <style> visada neįtraukiami.

Konvertavimo taisyklės

Elementai, paverčiami eilučių lūžiais (Standard)

  • <br>
  • <p>, antraštės (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Visada neįtraukiami elementai

  • <script>...</script>
  • <style>...</style>
  • Kai reikia, galite neįtraukti ir <noscript>.

Sąrašų formatavimo pavyzdžiai

  • <ul><li>Elementas</li></ul> -> - Elementas
  • <ol><li>Item</li></ol> -> - Item (Standard / Minimal)
  • <ol><li>Elementas</li></ol> -> 1. Elementas (Išsamiai)

DUK

Eilučių lūžiai atrodo keistai

Šis įrankis tokias žymas kaip <p> / <br> / <li> paverčia eilučių lūžiais. Pakoreguokite Line Break Rule ir Max Consecutive Line Breaks, kad priartėtumėte prie norimo formato.

Ar script/style blokai paliekami?

Ne. <script> ir <style> visada pašalinami.

Kaip dėl tokių entitetų kaip &amp; ?

Galite pasirinkti dekodavimą ĮJ. arba IŠJ. Įjunkite dekodavimą, kai norite, kad &amp; virstų &.

Kaip sumažinti perteklinius eilučių lūžius ir tarpus?

Naudokite Minimal taisyklę, laikykite Collapse Spaces ĮJ. ir nustatykite Max Consecutive Line Breaks į 1 arba 2.

Ar galiu palikti URL kartu su nuorodos tekstu?

Taip. Link Handling nustatykite į Text + URL.

Pastabos

  • Įrankis analizuoja įvesties HTML šaltinį; jis nevykdo skriptų ir neatkuria pilnos naršyklės atvaizdavimo išvesties.
  • Labai didelės įvestys gali būti konvertuojamos ilgiau.
  • Įvesties turinys nėra saugomas URL užklausos parametruose.