Question 1

Mon PDF est-il envoyé quelque part ?

Accepted Answer

Non. Le PDF est ouvert et analysé par ton propre navigateur avec une copie locale du moteur pdf.js. Le fichier ne quitte jamais ton appareil, ce qui le rend sûr pour les contrats, les factures et tout ce qui est confidentiel.

Question 2

Pourquoi convertir un PDF en Markdown pour l’IA ?

Accepted Answer

Les grands modèles de langage lisent du texte brut, pas des mises en page. Markdown donne au modèle les titres, les listes et les sauts de paragraphe dont il a besoin pour suivre ton document, et il coûte bien moins de tokens que de coller un PDF brut ou mal copié.

Question 3

Est-ce que ça marche sur les PDF scannés ?

Accepted Answer

Seulement si le PDF a une vraie couche de texte. Une page scannée ou photographiée n’est qu’une image, il n’y a donc rien à extraire — cela demande de l’OCR, que nous n’exécutons pas ici. Si une page revient vide, l’outil te le signale.

Question 4

Comment les titres sont-ils détectés ?

Accepted Answer

Aucun titre n’est stocké dans un PDF, nous les déduisons donc de la taille de police : les lignes nettement plus grandes deviennent des titres Markdown. C’est un bon point de départ, mais relis le résultat et corrige ce que la mise en page a trompé.

PDF en Markdown

D’une mise en page à du texte qu’un modèle peut lire

Pourquoi Markdown est le bon format pour l’IA

Local, privé et gratuit

Questions fréquentes

Utilitaires associés