Définition
RAG (Retrieval-Augmented Generation)
Technique couplant la recherche d'informations dans une base de données avec la génération de texte pour des réponses factuelles.
Publié le 4 mars 2026par ZoneIA
Le RAG combine un modèle de langage avec un mécanisme de recherche afin de produire des réponses plus ancrées dans des sources. Au lieu de s’appuyer uniquement sur ses paramètres (et donc risquer des hallucinations), le modèle récupère d’abord des passages pertinents, puis les utilise comme contexte pour générer la réponse.
Comment ça fonctionne
- Indexation : vos documents (PDF, pages web, tickets, wiki) sont découpés en “chunks” et stockés, souvent sous forme d’embeddings dans une base vectorielle.
- Retrieval : à la question, on calcule un embedding et on récupère les passages les plus similaires (top‑k), parfois avec un filtre (date, auteur, projet).
- Generation : le LLM reçoit la question + les extraits trouvés et rédige une réponse, idéalement avec citations.
À quoi ça sert
- Questions/réponses sur une documentation interne à jour.
- Assistants de support client avec des réponses conformes aux procédures.
- Recherche sémantique et synthèse multi-sources.
Points d’attention
La qualité dépend surtout du découpage, de l’index, du ranking et du prompt. Un mauvais retrieval donne une réponse plausible mais fausse. Des garde-fous (citations, seuils de confiance, fallback) sont souvent nécessaires.