Μετατροπέας HTML σε κείμενο (Αφαίρεση ετικετών και μορφοποίηση γραμμών)

Εξαγάγετε αναγνώσιμο κείμενο σώματος από HTML, μορφοποιήστε παραγράφους/λίστες και αφαιρέστε αυτόματα blocks script/style.

Επιλέξτε αποκωδικοποίηση entities και χειρισμό για συνδέσμους, εικόνες και πίνακες και μετά αντιγράψτε ή κατεβάστε το αποτέλεσμα σε μία ροή.

Η είσοδός σας επεξεργάζεται τοπικά σε αυτόν τον browser και δεν αποστέλλεται ποτέ σε server.

Αφαιρέστε HTML tags και εξαγάγετε μόνο κείμενο

Η είσοδος και η έξοδος εμφανίζονται δίπλα-δίπλα, ώστε να ρυθμίζετε κανόνες αλλαγών γραμμής και επιλογές με ελάχιστες δοκιμές.

Τι κάνει αυτό το εργαλείο

  • Αφαιρεί HTML tags
  • Μορφοποιεί αλλαγές γραμμής για παραγράφους και λίστες
  • Εξαιρεί πάντα script/style και προαιρετικά αποκωδικοποιεί entities

Τρόπος χρήσης

  1. Επικολλήστε HTML (ή φορτώστε αρχείο).
  2. Προσαρμόστε τις επιλογές μορφοποίησης αν χρειάζεται.
  3. Μετατρέψτε και μετά αντιγράψτε το αποτέλεσμα ή αποθηκεύστε το ως .txt.

Δείγμα

Τυπικός κανόνας

Είσοδος (HTML)

<article><h2>Ανακοίνωση</h2><p>Καλώς ήρθατε<br>στο Finite Field</p><ul><li>Εισαγωγή</li><li>Χρήση</li></ul></article>

Έξοδος (Κείμενο)

Ανακοίνωση

Καλώς ήρθατε
στο Finite Field

- Εισαγωγή
- Χρήση

Ελάχιστος κανόνας

Είσοδος (HTML)

<div><p>A</p><p>B</p></div>

Έξοδος (Κείμενο)

A
B

Λεπτομερής κανόνας

Είσοδος (HTML)

<ol><li>Ορίστε απαιτήσεις</li><li>Υλοποιήστε</li></ol>

Έξοδος (Κείμενο)

1. Ορίστε απαιτήσεις
2. Υλοποιήστε

Επιλογές μορφοποίησης

  • Εναλλαγή κανόνα αλλαγών γραμμής: Standard / Minimal / Detailed.
  • Επιλέξτε αν θα αποκωδικοποιούνται τα HTML entities.
  • Βελτιώστε την αναγνωσιμότητα με σύμπτυξη κενών και μέγιστο συνεχόμενων αλλαγών γραμμής.
  • Ελέγξτε τον χειρισμό σχολίων, συνδέσμων, εικόνων και πινάκων.

Σημείωση: Τα <script> και <style> εξαιρούνται πάντα.

Κανόνες μετατροπής

Στοιχεία που μετατρέπονται σε αλλαγές γραμμής (Standard)

  • <br>
  • <p>, επικεφαλίδες (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Στοιχεία που εξαιρούνται πάντα

  • <script>...</script>
  • <style>...</style>
  • Μπορείτε επίσης να εξαιρέσετε το <noscript> όταν χρειάζεται.

Παραδείγματα μορφοποίησης λίστας

  • <ul><li>Στοιχείο</li></ul> -> - Στοιχείο
  • <ol><li>Στοιχείο</li></ol> -> - Στοιχείο (Standard/Minimal)
  • <ol><li>Στοιχείο</li></ol> -> 1. Στοιχείο (Detailed)

Συχνές ερωτήσεις

Οι αλλαγές γραμμής φαίνονται περίεργες

Αυτό το εργαλείο μετατρέπει tags όπως <p>/<br>/<li> σε αλλαγές γραμμής. Προσαρμόστε τον Κανόνα αλλαγών γραμμής και το Μέγιστο συνεχόμενων αλλαγών γραμμής για να πλησιάσετε τη μορφή που θέλετε.

Διατηρούνται τα blocks script/style;

Όχι. Τα <script> και <style> αφαιρούνται πάντα.

Τι γίνεται με entities όπως το &amp; ;

Μπορείτε να επιλέξετε ενεργοποίηση/απενεργοποίηση αποκωδικοποίησης. Ενεργοποιήστε την όταν θέλετε το &amp; να γίνει &.

Πώς μπορώ να μειώσω τις επιπλέον αλλαγές γραμμής και τα κενά;

Χρησιμοποιήστε τον κανόνα Minimal, κρατήστε ενεργό το Collapse Spaces και ορίστε το Μέγιστο συνεχόμενων αλλαγών γραμμής σε 1 ή 2.

Μπορώ να κρατήσω τα URL μαζί με το κείμενο συνδέσμου;

Ναι. Ορίστε το Link Handling σε Text + URL.

Σημειώσεις

  • Το εργαλείο αναλύει τον πηγαίο HTML κώδικα εισόδου. Δεν εκτελεί scripts και δεν αναπαράγει πλήρως την απόδοση rendering του browser.
  • Πολύ μεγάλες είσοδοι μπορεί να χρειαστούν περισσότερο χρόνο για μετατροπή.
  • Το περιεχόμενο εισόδου δεν αποθηκεύεται σε query parameters URL.