Conversor de HTML a texto (eliminación de etiquetas y formato de líneas)

Extraiga texto legible del body HTML, formatee párrafos/listas y elimine automáticamente bloques script/style.

Elija decodificación de entidades y el tratamiento de enlaces, imágenes y tablas, y luego copie o descargue el resultado en un solo flujo.

La entrada se procesa localmente en este navegador y nunca se envía a un servidor.

Quitar etiquetas HTML y extraer solo texto

La entrada y la salida se muestran lado a lado, por lo que puede ajustar reglas de salto de línea y opciones con mínima prueba y error.

Qué hace esta herramienta

  • Quitar etiquetas HTML
  • Formatear saltos de línea para párrafos y listas
  • Excluir siempre script/style y decodificar entidades opcionalmente

Cómo usar

  1. Pegue HTML (o cargue un archivo).
  2. Ajuste las opciones de formato si es necesario.
  3. Convierta y luego copie el resultado o guárdelo como .txt.

Ejemplo

Regla estándar

Entrada (HTML)

<article><h2>Aviso</h2><p>Bienvenido<br>a Finite Field</p><ul><li>Introducción</li><li>Uso</li></ul></article>

Salida (texto)

Aviso

Bienvenido
a Finite Field

- Introducción
- Uso

Regla mínima

Entrada (HTML)

<div><p>A</p><p>B</p></div>

Salida (texto)

A
B

Regla detallada

Entrada (HTML)

<ol><li>Definir requisitos</li><li>Implementar</li></ol>

Salida (texto)

1. Definir requisitos
2. Implementar

Opciones de formato

  • Cambie la regla de saltos de línea: Estándar / Mínima / Detallada.
  • Elija si decodificar entidades HTML.
  • Ajuste la legibilidad con la compactación de espacios y el máximo de saltos de línea consecutivos.
  • Controle el tratamiento de comentarios, enlaces, imágenes y tablas.

Nota: <script> y <style> siempre se excluyen.

Reglas de conversión

Elementos convertidos en saltos de línea (Estándar)

  • <br>
  • <p>, encabezados (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elementos siempre excluidos

  • <script>...</script>
  • <style>...</style>
  • También puede excluir <noscript> si lo necesita.

Ejemplos de formato de listas

  • <ul><li>Elemento</li></ul> -> - Elemento
  • <ol><li>Item</li></ol> -> - Item (Estándar/Mínima)
  • <ol><li>Item</li></ol> -> 1. Item (Detallada)

Preguntas frecuentes

Los saltos de línea se ven raros

Esta herramienta convierte etiquetas como <p>/<br>/<li> en saltos de línea. Ajuste Regla de saltos de línea y Máximo de saltos consecutivos para acercarse al formato deseado.

¿Se conservan bloques script/style?

No. <script> y <style> siempre se eliminan.

¿Qué pasa con entidades como &amp; ?

Puede elegir decodificación activada/desactivada. Actívela cuando quiera que &amp; se convierta en &.

¿Cómo reduzco saltos de línea y espacios extra?

Use la regla Mínima, mantenga activada la compactación de espacios y establezca Máximo de saltos consecutivos en 1 o 2.

¿Puedo conservar URLs junto con el texto del enlace?

Sí. Defina el tratamiento de enlaces en Texto + URL.

Notas

  • La herramienta analiza el código fuente HTML de entrada; no ejecuta scripts ni reproduce el renderizado completo del navegador.
  • Las entradas muy grandes pueden tardar más en convertirse.
  • El contenido de entrada no se almacena en parámetros de query URL.