HTML→テキスト変換(タグ除去・改行整形)

HTMLから本文テキストだけを抽出します。段落やリストの改行を整形し、script/styleは除外します。

エンティティのデコードやリンク・画像・テーブルの扱いを選び、コピーや.txt保存まで1画面で完了できます。

入力内容はこのブラウザ内で処理され、サーバーへ送信されません。

HTMLタグを消してテキストだけ抽出する

入力HTMLと出力テキストを並べて確認できるため、変換結果を見ながら改行ルールやオプションを最小調整で仕上げられます。

このツールでできること

  • HTMLのタグ除去
  • 段落・リストの改行整形
  • script/style除外と、エンティティデコード切替

使い方

  1. HTMLを貼り付ける(またはファイルを読み込む)。
  2. 必要なら整形オプションを調整する。
  3. 変換して、結果をコピーまたは.txtで保存する。

サンプル

標準ルール

入力(HTML)

<article><h2>お知らせ</h2><p>ようこそ<br>Finite Fieldへ</p><ul><li>導入</li><li>活用</li></ul></article>

出力(テキスト)

お知らせ

ようこそ
Finite Fieldへ

・導入
・活用

最小ルール

入力(HTML)

<div><p>A</p><p>B</p></div>

出力(テキスト)

A
B

しっかりルール

入力(HTML)

<ol><li>要件定義</li><li>実装</li></ol>

出力(テキスト)

1. 要件定義
2. 実装

整形オプション

  • 改行ルール(標準/最小/しっかり)を切り替えられます。
  • HTMLエンティティのデコード有無を選べます。
  • 空白縮約と連続改行上限で読みやすさを調整できます。
  • コメント、リンク、画像、テーブルの扱いを実務用途に合わせて変更できます。

※ <script> と <style> は常に除外します。

変換ルール

改行に変換する要素(標準)

  • <br>
  • <p>, 見出し(h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

除外する要素(固定)

  • <script>...</script>
  • <style>...</style>
  • 必要に応じて <noscript> も除外できます。

リスト整形の例

  • <ul><li>項目</li></ul> → ・項目
  • <ol><li>項目</li></ol> → 標準/最小では・項目
  • <ol><li>項目</li></ol> → しっかりでは 1. 項目

FAQ

改行が変になる

<p>/<br>/<li> などを改行へ変換しています。改行ルール(標準/最小/しっかり)と連続改行の上限を調整してください。

script/styleも残りますか?

いいえ。<script> と <style> は常に除外します。

エンティティ(&amp; など)はどうなりますか?

デコードする/しないを選べます。&amp; を & に戻したい場合はデコードをONにしてください。

改行や空白をもっと減らしたい

改行ルールを最小にし、空白縮約ON、連続改行上限を1〜2に設定してください。

URLも一緒に取り出したい

リンクの扱いを「テキスト + URL」にすると文脈とURLを同時に残せます。

関連ツール

注意事項

  • HTMLの描画結果ではなく、入力されたHTML文字列を解析して抽出します。
  • 入力が非常に大きい場合は、変換に時間がかかることがあります。
  • URLクエリには入力内容を保存しません。