Interrogez un document
Uploadez un PDF ou choisissez un document exemple, puis posez vos questions en langage naturel. Le systeme analyse le document, identifie les passages pertinents et genere une reponse sourcee.
Upload
Glissez votre PDF ou choisissez un document exemple
Indexation
Le document est decoupe et indexe via embeddings vectoriels
Questions
Posez vos questions et obtenez des reponses avec sources
Comment ca marche
Extraction et decoupage
Le PDF est parse avec PyMuPDF. Le texte est decoupe en passages de ~500 tokens avec un recouvrement de 50 tokens pour preserver le contexte.
Embeddings vectoriels
Chaque passage est converti en vecteur via le modele all-MiniLM-L6-v2 (sentence-transformers) et stocke dans ChromaDB.
Recherche semantique
Votre question est vectorisee et comparee aux passages par similarite cosinus. Les 5 passages les plus pertinents sont selectionnes.
Generation de reponse
Claude (Anthropic) genere une reponse structuree en se basant uniquement sur les passages recuperes, avec citation des pages sources.