Konverter HTML ke Teks (Hapus Tag & Format Baris)

Ekstrak isi teks yang mudah dibaca dari HTML, format paragraf/daftar, dan hapus blok script/style secara otomatis.

Pilih decode entity serta penanganan tautan, gambar, dan tabel, lalu salin atau unduh hasilnya dalam satu alur.

Input Anda diproses secara lokal di browser ini dan tidak pernah dikirim ke server.

Hapus tag HTML dan ambil hanya teks

Input dan output ditampilkan berdampingan, sehingga Anda bisa menyesuaikan aturan line break dan opsi dengan percobaan minimal.

Yang dilakukan alat ini

  • Menghapus tag HTML
  • Memformat line break untuk paragraf dan daftar
  • Selalu mengecualikan script/style dan secara opsional mendecode entity

Cara menggunakan

  1. Tempel HTML (atau muat file).
  2. Sesuaikan opsi formatting bila perlu.
  3. Konversi, lalu salin hasilnya atau simpan sebagai .txt.

Contoh

Aturan standar

Masukan (HTML)

<article><h2>Pemberitahuan</h2><p>Selamat datang<br>di Finite Field</p><ul><li>Pengantar</li><li>Penggunaan</li></ul></article>

Output (Teks)

Pemberitahuan

Selamat datang
di Finite Field

- Pengantar
- Penggunaan

Aturan minimal

Masukan (HTML)

<div><p>A</p><p>B</p></div>

Output (Teks)

A
B

Aturan detail

Masukan (HTML)

<ol><li>Tentukan kebutuhan</li><li>Implementasikan</li></ol>

Output (Teks)

1. Tentukan kebutuhan
2. Implementasikan

Opsi formatting

  • Ganti aturan line break: Standard / Minimal / Detailed.
  • Pilih apakah HTML entity perlu didecode.
  • Atur keterbacaan dengan penggabungan spasi dan batas line break berturut-turut.
  • Kontrol penanganan komentar, tautan, gambar, dan tabel.

Catatan: <script> dan <style> selalu dikecualikan.

Aturan konversi

Elemen yang diubah menjadi line break (Standard)

  • <br>
  • <p>, heading (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elemen yang selalu dikecualikan

  • <script>...</script>
  • <style>...</style>
  • Anda juga dapat mengecualikan <noscript> bila diperlukan.

Contoh formatting daftar

  • <ul><li>Butir</li></ul> -> - Butir
  • <ol><li>Butir</li></ol> -> - Butir (Standar/Minimal)
  • <ol><li>Butir</li></ol> -> 1. Butir (Terperinci)

Pertanyaan umum

Line break terlihat aneh

Alat ini mengubah tag seperti <p>/<br>/<li> menjadi line break. Atur Aturan Line Break dan Jumlah Maksimum Line Break Berturut-turut agar lebih mendekati format yang Anda inginkan.

Apakah blok script/style dipertahankan?

Tidak. <script> dan <style> selalu dihapus.

Bagaimana dengan entity seperti &amp; ?

Anda dapat memilih decode aktif/nonaktif. Aktifkan decode jika ingin &amp; berubah menjadi &.

Bagaimana cara mengurangi line break dan spasi berlebih?

Gunakan aturan Minimal, biarkan Collapse Spaces aktif, dan atur Max Consecutive Line Breaks ke 1 atau 2.

Bisakah saya mempertahankan URL bersama teks tautan?

Ya. Atur Link Handling ke Text + URL.

Catatan

  • Alat ini mem-parse source HTML input; alat ini tidak mengeksekusi script atau meniru hasil render penuh browser.
  • Input yang sangat besar dapat memerlukan waktu lebih lama untuk dikonversi.
  • Konten input tidak disimpan di query parameter URL.