HTML 轉文字工具(移除標籤與整理換行)

從 HTML 中抽取可讀的正文文字,自動整理段落 / 清單格式,並移除 script/style 區塊。

可選擇 entity 解碼,以及連結、圖片、表格的處理方式,再於同一流程中複製或下載結果。

你的輸入只會在此瀏覽器本機處理,絕不會傳送到伺服器。

移除 HTML 標籤,只保留文字

輸入與輸出會並排顯示,方便你以較少的反覆嘗試調整換行規則與選項。

此工具可做什麼

  • 移除 HTML 標籤
  • 整理段落與清單換行
  • 固定排除 script/style,並可選擇是否解碼 entities

使用方式

  1. 貼上 HTML(或載入檔案)。
  2. 需要時調整格式化選項。
  3. 執行轉換後,再複製結果或另存為 .txt。

範例

標準規則

輸入(HTML)

<article><h2>通知</h2><p>歡迎<br>來到 Finite Field</p><ul><li>介紹</li><li>使用方式</li></ul></article>

輸出(文字)

通知

歡迎
來到 Finite Field

•介紹
•使用方式

最小規則

輸入(HTML)

<div><p>A</p><p>B</p></div>

輸出(文字)

A
B

詳細規則

輸入(HTML)

<ol><li>定義需求</li><li>實作</li></ol>

輸出(文字)

1. 定義需求
2. 實作

格式化選項

  • 可切換換行規則:標準 / 最小 / 詳細。
  • 可選擇是否解碼 HTML entities。
  • 可透過合併空白與限制最大連續換行數來調整可讀性。
  • 可控制註解、連結、圖片與表格的處理方式。

注意:<script> 與 <style> 一律排除。

轉換規則

會轉為換行的元素(標準)

  • <br>
  • <p>、標題(h1-h6)、<li>
  • <div>、<section>、<article>、<header>、<footer>、<blockquote>

固定排除的元素

  • <script>...</script>
  • <style>...</style>
  • 需要時也可排除 <noscript>。

清單格式化範例

  • <ul><li>Item</li></ul> -> •Item
  • <ol><li>Item</li></ol> -> •Item(標準 / 最小)
  • <ol><li>Item</li></ol> -> 1. Item(詳細)

FAQ

換行看起來不太自然

此工具會把 <p> / <br> / <li> 等標籤轉為換行。請調整「換行規則」與「最大連續換行數」,讓結果更接近你的目標格式。

會保留 script / style 區塊嗎?

不會。<script> 與 <style> 一律移除。

&amp; 這類 entities 會怎麼處理?

你可以選擇是否解碼。若希望 &amp; 變成 &,請開啟解碼。

如何減少多餘換行與空白?

請使用最小規則、保持「合併空白」開啟,並將「最大連續換行數」設為 1 或 2。

可以保留連結文字與 URL 嗎?

可以。將「連結處理」設為「文字 + URL」即可。

注意事項

  • 此工具會解析輸入的 HTML 原始碼,但不會執行 script,也不會重現完整的瀏覽器渲染結果。
  • 非常大的輸入可能需要較長時間轉換。
  • 輸入內容不會保存在 URL 查詢參數中。