IQ
PayloadIQ
Utilitaires PayloadIQ

Nettoyeur HTML

Colle du HTML surchargé et récupère un balisage propre, sémantique et lisible — scripts et styles supprimés, attributs retirés, div d'habillage aplaties. Tout s'exécute dans ton navigateur.

Cleaned, semantic HTML appears here.

S'exécute dans ton navigateur. Ce que tu saisis n'est pas envoyé à PayloadIQ.

Le Nettoyeur HTML réduit du HTML surchargé en balisage propre et sémantique, entièrement dans ton navigateur. Il retire toujours les scripts, les styles, les commentaires, les iframe et les gestionnaires d'événements, puis, selon les options que tu actives, dépouille les attributs jusqu'à une courte liste de contenu (href, src, alt, title…), aplatit les div et span d'habillage, convertit les balises de présentation comme font et center en leurs équivalents réels, et supprime les éléments vides. Le résultat est du HTML lisible, prêt à relire, à publier ou à donner à un LLM. Rien n'est envoyé : tout reste sur ton appareil.

De la soupe de div au HTML sémantique

Quand tu copies du HTML depuis un site, un CMS ou un e-mail, tu hérites d'un enchevêtrement de div d'habillage, de styles en ligne, de classes de framework et d'attributs de traçage. Le nettoyeur analyse le code avec le moteur natif du navigateur, puis le reconstruit en balisage minimal et sémantique : les balises de présentation deviennent leurs vrais équivalents (b devient strong, i devient em), les conteneurs de mise en page sont aplatis, les attributs sont réduits à une petite liste de contenu, et ce qui reste est joliment indenté. Chaque étape est une option à cocher, donc c'est toi qui décides à quel point le nettoyage est agressif.

Local, sûr, et meilleur contexte pour l'IA

Un modèle qui lit du HTML paie en tokens chaque classe, chaque style et chaque conteneur superflu qu'il doit ignorer, et la structure se perd souvent dans le bruit. Le HTML sémantique conserve les titres, les listes et les tableaux qui portent le sens et abandonne le reste — c'est aussi la meilleure entrée possible pour une conversion en Markdown : HTML propre en entrée, Markdown propre en sortie. Côté sécurité, les scripts, les gestionnaires d'événements et les liens javascript: sont toujours supprimés, et rien de ce que tu colles ne quitte ton navigateur. Copie le résultat ou télécharge un fichier .html.

Questions fréquentes

Qu'est-ce que le nettoyeur retire vraiment ?
Toujours : les scripts, les styles, les commentaires, les iframe et les gestionnaires d'événements. En option : tous les attributs sauf une courte liste de contenu (href, src, alt, title…), les balises div et span d'habillage, les balises de présentation comme font et center, la navigation (nav et aside) et les éléments restés vides. C'est toi qui choisis avec les options.
Pourquoi nettoyer le HTML avant de le donner à un LLM ?
Le HTML web brut est surtout du bruit pour un modèle — classes, styles en ligne, attributs de traçage et div d'habillage imbriquées. Le réduire en HTML sémantique conserve le sens (titres, listes, tableaux, liens) tout en allégeant le balisage, donc le modèle dépense son contexte sur le contenu, pas sur les balises. Et ça se convertit en Markdown bien plus propre.
Est-ce que mon HTML est envoyé quelque part ?
Non. Le nettoyage s'exécute dans ton navigateur avec l'analyseur HTML natif. Tout ce que tu colles reste sur ton appareil, rien n'est téléversé sur un serveur.
Comment ça se combine avec le convertisseur Markdown ?
Le HTML propre est l'entrée idéale pour l'outil HTML en Markdown : un balisage net et sémantique produit un Markdown net et prévisible. Nettoie ici d'abord, puis convertis — tu obtiens le meilleur contexte possible à donner à une IA.

Utilitaires associés

Testeur de regexAperçu MarkdownMarkdown vers HTMLGénérateur de tableau Markdown
Ouvrir le PayloadIQ Playground