HTML to Text 변환기 (태그 제거 및 줄 형식 정리)

HTML에서 읽기 쉬운 본문 텍스트를 추출하고, 문단/목록 형식을 정리하며, script/style 블록을 자동 제거합니다.

엔티티 디코딩과 링크, 이미지, 표 처리 방식을 고른 뒤 결과를 복사하거나 다운로드할 수 있습니다.

입력은 브라우저에서 로컬로 처리되며 서버로 전송되지 않습니다.

HTML 태그를 제거하고 텍스트만 추출

입력과 출력이 나란히 표시되어, 줄바꿈 규칙과 옵션을 최소한의 시행착오로 조정할 수 있습니다.

이 도구로 할 수 있는 일

  • HTML 태그 제거
  • 문단과 목록의 줄바꿈 형식 정리
  • script/style는 항상 제외하고, 엔티티 디코딩은 선택 가능

사용 방법

  1. HTML을 붙여넣거나 파일을 불러옵니다.
  2. 필요하면 서식 옵션을 조정합니다.
  3. 변환한 뒤 결과를 복사하거나 .txt로 저장합니다.

샘플

표준 규칙

입력 (HTML)

<article><h2>Notice</h2><p>Welcome<br>to Finite Field</p><ul><li>Intro</li><li>Usage</li></ul></article>

출력 (텍스트)

Notice

Welcome
to Finite Field

- Intro
- Usage

최소 규칙

입력 (HTML)

<div><p>A</p><p>B</p></div>

출력 (텍스트)

A
B

상세 규칙

입력 (HTML)

<ol><li>Define requirements</li><li>Implement</li></ol>

출력 (텍스트)

1. Define requirements
2. Implement

서식 옵션

  • 줄바꿈 규칙을 전환: 표준 / 최소 / 상세.
  • HTML 엔티티 디코딩 여부 선택.
  • 연속 공백 축소와 최대 연속 줄바꿈 수로 가독성 조정.
  • 주석, 링크, 이미지, 표 처리 방식을 제어.

참고: <script>와 <style>는 항상 제외됩니다.

변환 규칙

줄바꿈으로 변환되는 요소 (표준)

  • <br>
  • <p>, 제목(h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

항상 제외되는 요소

  • <script>...</script>
  • <style>...</style>
  • 필요하면 <noscript>도 제외할 수 있습니다.

목록 형식 예시

  • <ul><li>Item</li></ul> -> - Item
  • <ol><li>Item</li></ol> -> - Item (표준/최소)
  • <ol><li>Item</li></ol> -> 1. Item (상세)

FAQ

줄바꿈이 이상하게 보입니다

이 도구는 <p>/<br>/<li> 같은 태그를 줄바꿈으로 변환합니다. 목표 형식에 맞추려면 줄바꿈 규칙과 최대 연속 줄바꿈 수를 조정하세요.

script/style 블록도 남나요?

아니요. <script>와 <style>는 항상 제거됩니다.

&amp; 같은 엔티티는 어떻게 되나요?

디코딩 ON/OFF를 선택할 수 있습니다. &amp;를 &로 바꾸려면 디코딩을 켜세요.

불필요한 줄바꿈과 공백을 줄이려면 어떻게 하나요?

최소 규칙을 사용하고, 공백 축소를 켠 상태에서 최대 연속 줄바꿈 수를 1 또는 2로 설정하세요.

링크 텍스트와 URL을 함께 유지할 수 있나요?

예. 링크 처리 방식을 Text + URL로 설정하세요.

주의

  • 이 도구는 입력 HTML 소스를 파싱할 뿐, 스크립트를 실행하거나 브라우저의 완전한 렌더링 결과를 재현하지는 않습니다.
  • 입력이 매우 크면 변환 시간이 더 걸릴 수 있습니다.
  • 입력 내용은 URL 쿼리 파라미터에 저장되지 않습니다.