Interrogez un document

Uploadez un PDF ou choisissez un document exemple, puis posez vos questions en langage naturel. Le systeme analyse le document, identifie les passages pertinents et genere une reponse sourcee.

Upload

Glissez votre PDF ou choisissez un document exemple

Indexation

Le document est decoupe et indexe via embeddings vectoriels

Questions

Posez vos questions et obtenez des reponses avec sources

Comment ca marche

Extraction et decoupage

Le PDF est parse avec PyMuPDF. Le texte est decoupe en passages de ~500 tokens avec un recouvrement de 50 tokens pour preserver le contexte.

Embeddings vectoriels

Chaque passage est converti en vecteur via le modele all-MiniLM-L6-v2 (sentence-transformers) et stocke dans ChromaDB.

Recherche semantique

Votre question est vectorisee et comparee aux passages par similarite cosinus. Les 5 passages les plus pertinents sont selectionnes.

Generation de reponse

Claude (Anthropic) genere une reponse structuree en se basant uniquement sur les passages recuperes, avec citation des pages sources.