ตัวแปลง HTML เป็นข้อความ (ลบแท็กและจัดรูปแบบบรรทัด)

ดึงเฉพาะข้อความเนื้อหาที่อ่านง่ายจาก HTML จัดรูปแบบย่อหน้า/รายการ และลบบล็อก script/style โดยอัตโนมัติ

เลือกการถอดรหัส entity และวิธีจัดการลิงก์ รูปภาพ และตาราง จากนั้นคัดลอกหรือดาวน์โหลดผลลัพธ์ได้ในขั้นตอนเดียว

อินพุตของคุณถูกประมวลผลในเบราว์เซอร์นี้แบบภายในเครื่องและจะไม่ถูกส่งไปยังเซิร์ฟเวอร์

ลบแท็ก HTML และดึงเฉพาะข้อความ

อินพุตและเอาต์พุตจะแสดงแบบขนานกัน จึงปรับกฎการขึ้นบรรทัดและตัวเลือกต่าง ๆ ได้โดยลองผิดลองถูกน้อยที่สุด

เครื่องมือนี้ทำอะไรได้บ้าง

  • ลบแท็ก HTML
  • จัดรูปแบบการขึ้นบรรทัดของย่อหน้าและรายการ
  • ตัด script/style ออกเสมอ และเลือกถอดรหัส entity ได้

วิธีใช้งาน

  1. วาง HTML (หรือโหลดไฟล์)
  2. ปรับตัวเลือกการจัดรูปแบบหากต้องการ
  3. แปลง แล้วคัดลอกผลลัพธ์หรือบันทึกเป็น .txt

ตัวอย่าง

กฎมาตรฐาน

อินพุต (HTML)

<article><h2>ประกาศ</h2><p>ยินดีต้อนรับ<br>สู่ Finite Field</p><ul><li>บทนำ</li><li>การใช้งาน</li></ul></article>

เอาต์พุต (ข้อความ)

ประกาศ

ยินดีต้อนรับ
สู่ Finite Field

- บทนำ
- การใช้งาน

กฎแบบย่อ

อินพุต (HTML)

<div><p>A</p><p>B</p></div>

เอาต์พุต (ข้อความ)

A
B

กฎแบบละเอียด

อินพุต (HTML)

<ol><li>กำหนดความต้องการ</li><li>นำไปใช้</li></ol>

เอาต์พุต (ข้อความ)

1. กำหนดความต้องการ
2. นำไปใช้

ตัวเลือกการจัดรูปแบบ

  • สลับกฎการขึ้นบรรทัด: Standard / Minimal / Detailed
  • เลือกว่าจะถอดรหัส HTML entities หรือไม่
  • ปรับให้อ่านง่ายขึ้นด้วยการรวมช่องว่างและกำหนดจำนวนการขึ้นบรรทัดต่อเนื่องสูงสุด
  • ควบคุมการจัดการ comments, links, images และ tables

หมายเหตุ: <script> และ <style> จะถูกตัดออกเสมอ

กฎการแปลง

องค์ประกอบที่จะแปลงเป็นการขึ้นบรรทัด (Standard)

  • <br>
  • <p>, หัวเรื่อง (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

องค์ประกอบที่ถูกตัดออกเสมอ

  • <script>...</script>
  • <style>...</style>
  • คุณสามารถเลือกตัด <noscript> ออกได้เมื่อจำเป็น

ตัวอย่างการจัดรูปแบบรายการ

  • <ul><li>รายการ</li></ul> -> - รายการ
  • <ol><li>รายการ</li></ol> -> - รายการ (มาตรฐาน/ขั้นต่ำ)
  • <ol><li>รายการ</li></ol> -> 1. รายการ (แบบละเอียด)

คำถามที่พบบ่อย

การขึ้นบรรทัดดูแปลก ๆ

เครื่องมือนี้จะแปลงแท็กอย่าง <p>/<br>/<li> เป็นการขึ้นบรรทัด ปรับ Line Break Rule และ Max Consecutive Line Breaks เพื่อให้ใกล้กับรูปแบบที่คุณต้องการมากขึ้น

บล็อก script/style จะถูกเก็บไว้หรือไม่?

ไม่ <script> และ <style> จะถูกลบออกเสมอ

แล้ว entities อย่าง &amp; ล่ะ?

คุณสามารถเลือกเปิดหรือปิดการถอดรหัสได้ เปิดเมื่อคุณต้องการให้ &amp; กลายเป็น &

ฉันจะลดการขึ้นบรรทัดและช่องว่างส่วนเกินได้อย่างไร?

ใช้กฎ Minimal เปิด Collapse Spaces ไว้ และตั้ง Max Consecutive Line Breaks เป็น 1 หรือ 2

สามารถเก็บ URL ไว้พร้อมข้อความลิงก์ได้หรือไม่?

ได้ ตั้งค่า Link Handling เป็น Text + URL

ข้อควรทราบ

  • เครื่องมือนี้แยกวิเคราะห์ source HTML ที่ป้อนเข้า ไม่ได้รัน script หรือจำลองผลการเรนเดอร์ของเบราว์เซอร์แบบเต็ม
  • อินพุตที่มีขนาดใหญ่มากอาจใช้เวลาแปลงนานขึ้น
  • เนื้อหาอินพุตจะไม่ถูกเก็บไว้ในพารามิเตอร์ query ของ URL