Konvertuesi HTML në tekst (heqje etiketash dhe formatim rreshtash)

Nxirr tekstin kryesor të lexueshëm nga HTML, formato paragrafët/listat dhe hiq automatikisht blloqet script/style.

Zgjidh dekodimin e entiteteve dhe trajtimin e lidhjeve, imazheve dhe tabelave, pastaj kopjo ose shkarko rezultatin në një rrjedhë të vetme.

Hyrja jote përpunohet lokalisht në këtë shfletues dhe nuk dërgohet kurrë në server.

Hiq etiketat HTML dhe nxirr vetëm tekstin

Hyrja dhe dalja shfaqen krah për krah, kështu që mund të rregullosh rregullat e thyerjeve të rreshtit dhe opsionet me pak prova.

Çfarë bën ky mjet

  • Heq etiketat HTML
  • Formaton thyerjet e rreshtit për paragrafë dhe lista
  • Përjashton gjithmonë script/style dhe sipas dëshirës dekodon entitetet

Si përdoret

  1. Ngjit HTML (ose ngarko një skedar).
  2. Rregullo opsionet e formatimit nëse duhet.
  3. Konvertoje, pastaj kopjo rezultatin ose ruaje si .txt.

Shembull

Rregulli standard

Hyrja (HTML)

<article><h2>Notice</h2><p>Welcome<br>to Finite Field</p><ul><li>Intro</li><li>Usage</li></ul></article>

Dalja (tekst)

Notice

Welcome
to Finite Field

- Intro
- Usage

Rregulli minimal

Hyrja (HTML)

<div><p>A</p><p>B</p></div>

Dalja (tekst)

A
B

Rregulli i detajuar

Hyrja (HTML)

<ol><li>Define requirements</li><li>Implement</li></ol>

Dalja (tekst)

1. Define requirements
2. Implement

Opsionet e formatimit

  • Ndërro rregullin e thyerjes së rreshtit: Standard / Minimal / I detajuar.
  • Zgjidh nëse do të dekodohen entitetet HTML.
  • Rregullo lexueshmërinë me bashkimin e hapësirave dhe maksimumin e thyerjeve të njëpasnjëshme të rreshtit.
  • Kontrollo trajtimin e komenteve, lidhjeve, imazheve dhe tabelave.

Shënim: <script> dhe <style> përjashtohen gjithmonë.

Rregullat e konvertimit

Elementet e konvertuara në thyerje rreshti (Standard)

  • <br>
  • <p>, headings (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elementet që përjashtohen gjithmonë

  • <script>...</script>
  • <style>...</style>
  • Mund të përjashtosh gjithashtu <noscript> kur të duhet.

Shembuj formatimi për lista

  • <ul><li>Item</li></ul> -> - Item
  • <ol><li>Item</li></ol> -> - Item (Standard/Minimal)
  • <ol><li>Item</li></ol> -> 1. Item (I detajuar)

Pyetje të shpeshta

Thyerjet e rreshtit duken të çuditshme

Ky mjet i kthen etiketa si <p>/<br>/<li> në thyerje rreshti. Rregullo rregullin e thyerjes së rreshtit dhe numrin maksimal të thyerjeve të njëpasnjëshme të rreshtit që të afrohesh më shumë me formatin që dëshiron.

A ruhen blloqet script/style?

Jo. <script> dhe <style> hiqen gjithmonë.

Po për entitete si &amp; ?

Mund të zgjedhësh dekodimin aktiv/joaktiv. Aktivizoje kur dëshiron që &amp; të bëhet &.

Si mund të zvogëloj thyerjet shtesë të rreshtit dhe hapësirat?

Përdor rregullin Minimal, mbaj aktiv bashkimin e hapësirave dhe vendos numrin maksimal të thyerjeve të njëpasnjëshme të rreshtit në 1 ose 2.

A mund t'i ruaj URL-të bashkë me tekstin e lidhjes?

Po. Vendos Link Handling te Text + URL.

Shënime

  • Mjeti analizon burimin HTML hyrës; nuk ekzekuton script-e dhe nuk riprodhon daljen e plotë të renderimit të shfletuesit.
  • Hyrjet shumë të mëdha mund të kërkojnë më shumë kohë për t'u konvertuar.
  • Përmbajtja hyrëse nuk ruhet në parametrat query të URL-së.