Conversor HTML → Texto (Remover Tags e Limpar Quebras de Linha)
Extraia texto legível de HTML colado. Parágrafos e listas mantêm quebras de linha naturais, scripts e estilos são sempre removidos e a decodificaçâo de entidades é opcional.
Opções de Formatação
Nota: <script> e <style> são sempre removidos.
Abrir opções de formatação
Remova tags HTML e extraia texto limpo
Limpar tags HTML
Remova a marcação e mantenha apenas o corpo do texto legível.
Quebras de parágrafo e lista
Trate <p>/<br>/<li> como quebras de linha naturais.
Script/estilo excluídos + opção de entidade
script/style são sempre removidos, e a decodificação de entidades é opcional.
Como usar
Cole o HTML na área de entrada ou carregue um arquivo.
Escolha as regras de quebra de linha e como lidar com links/imagens.
Clique em Converter e, em seguida, copie ou baixe como .txt.
Exemplo
<article>
<h2>Título</h2>
<p>Cole o HTML para converter.</p>
<ol>
<li>Passo 1</li>
<li>Passo 2</li>
</ol>
<p>Detalhes no <a href="https://example.com">site oficial</a>.</p>
</article>
Título Cole o HTML para converter. • Passo 1 • Passo 2 Detalhes no site oficial.
Título Cole o HTML para converter. Detalhes no site oficial. • Passo 1 • Passo 2
Título Cole o HTML para converter. 1. Passo 1 2. Passo 2 Detalhes no site oficial.
Regras de conversão
As quebras de linha e exclusões seguem estas regras.
Elementos convertidos em quebras (padrão)
- <br>
- <p>...</p>
- Cabeçalhos: <h1>–<h6>
- Listas: <li> (adiciona um marcador)
- Blocos: <div>, <section>, <article>, <header>, <footer>, <blockquote>
Elementos que costumam adicionar linhas vazias
- </p>, </section>, </article> (combinados com o máximo de quebras)
Sempre excluídos
- <script>...</script>
- <style>...</style>
- <noscript>...</noscript>
Exemplos de formatação de lista
- <ul><li>Item</li></ul> → • Item
- <ol><li>Item</li></ol> → 1. Item (modo detalhado)
Notas e dicas
Apenas no lado do cliente
Sua entrada permanece no navegador e nunca é carregada.
script/style removidos
Para segurança e legibilidade, script e style são sempre retirados.
Opções de exportação de tabela
TSV é o padrão, com opções de espaço ou linha única disponíveis.
FAQ
As quebras de linha parecem estranhas
<p>, <br> e <li> são convertidos em quebras de linha. Tente alterar a regra de quebra (padrão/mínima/detalhada) e a configuração de quebras máximas.
Script e style são mantidos?
Não. <script> e <style> são sempre removidos para segurança e legibilidade.
O que acontece com entidades como &?
Você pode escolher decodificar ou manter. Ative 'Decodificar entidades HTML' para transformar & em &.
Quero menos quebras e espaços
Use Quebras mínimas, ative Colapsar espaços consecutivos e defina o máximo de quebras para 1 ou 2.
Posso manter as URLs também?
Defina o tratamento de links para “Texto + URL” para manter o contexto e as URLs juntos.