Convertisseur HTML vers texte (suppression des balises et formatage des lignes)

Extrayez un texte lisible a partir du HTML, formatez les paragraphes/listes et supprimez automatiquement les blocs script/style.

Choisissez le decodage des entites et le traitement des liens, images et tableaux, puis copiez ou telechargez le resultat dans le meme flux.

Votre saisie est traitee localement dans ce navigateur et n'est jamais envoyee a un serveur.

Supprimer les balises HTML et n'extraire que le texte

L'entree et la sortie s'affichent cote a cote, ce qui vous permet d'ajuster les regles de saut de ligne et les options avec un minimum d'essais.

Ce que fait cet outil

  • Supprimer les balises HTML
  • Formater les sauts de ligne pour les paragraphes et les listes
  • Toujours exclure script/style et, en option, decoder les entites

Comment l'utiliser

  1. Collez du HTML (ou chargez un fichier).
  2. Ajustez si besoin les options de formatage.
  3. Convertissez, puis copiez le resultat ou enregistrez-le en .txt.

Exemple

Regle standard

Entree (HTML)

<article><h2>Avis</h2><p>Bienvenue<br>chez Finite Field</p><ul><li>Introduction</li><li>Utilisation</li></ul></article>

Sortie (texte)

Avis

Bienvenue
chez Finite Field

- Introduction
- Utilisation

Regle minimale

Entree (HTML)

<div><p>A</p><p>B</p></div>

Sortie (texte)

A
B

Regle detaillee

Entree (HTML)

<ol><li>Definir les exigences</li><li>Implementer</li></ol>

Sortie (texte)

1. Definir les exigences
2. Implementer

Options de formatage

  • Changez la regle de saut de ligne : Standard / Minimal / Detaillee.
  • Choisissez d'activer ou non le decodage des entites HTML.
  • Ajustez la lisibilite avec la fusion des espaces et le nombre maximum de sauts de ligne consecutifs.
  • Controlez le traitement des commentaires, liens, images et tableaux.

Note : <script> et <style> sont toujours exclus.

Regles de conversion

Elements convertis en sauts de ligne (Standard)

  • <br>
  • <p>, titres (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

Elements toujours exclus

  • <script>...</script>
  • <style>...</style>
  • Vous pouvez aussi exclure <noscript> si necessaire.

Exemples de formatage des listes

  • <ul><li>Element</li></ul> -> - Element
  • <ol><li>Element</li></ol> -> - Element (Standard/Minimal)
  • <ol><li>Element</li></ol> -> 1. Element (Detaille)

FAQ

Les sauts de ligne semblent etranges

Cet outil convertit des balises comme <p>/<br>/<li> en sauts de ligne. Ajustez la regle de saut de ligne et le nombre maximal de sauts consecutifs pour vous rapprocher du format voulu.

Les blocs script/style sont-ils conserves ?

Non. <script> et <style> sont toujours supprimes.

Qu'en est-il des entites comme &amp; ?

Vous pouvez choisir d'activer ou non le decodage. Activez-le si vous voulez que &amp; devienne &.

Comment reduire les sauts de ligne et espaces en trop ?

Utilisez la regle Minimale, laissez Fusion des espaces activee et definissez le maximum de sauts de ligne consecutifs a 1 ou 2.

Puis-je conserver les URL avec le texte du lien ?

Oui. Definissez le traitement des liens sur Texte + URL.

Remarques

  • L'outil analyse le code source HTML saisi ; il n'execute pas les scripts et ne reproduit pas le rendu complet d'un navigateur.
  • Les entrees tres volumineuses peuvent demander plus de temps pour etre converties.
  • Le contenu saisi n'est pas stocke dans les parametres de requete de l'URL.