Définition

RAG (Retrieval-Augmented Generation)

Technique couplant la recherche d'informations dans une base de données avec la génération de texte pour des réponses factuelles.

Publié le 4 mars 2026par ZoneIA

Le RAG combine un modèle de langage avec un mécanisme de recherche afin de produire des réponses plus ancrées dans des sources. Au lieu de s’appuyer uniquement sur ses paramètres (et donc risquer des hallucinations), le modèle récupère d’abord des passages pertinents, puis les utilise comme contexte pour générer la réponse.

Comment ça fonctionne

Indexation : vos documents (PDF, pages web, tickets, wiki) sont découpés en “chunks” et stockés, souvent sous forme d’embeddings dans une base vectorielle.
Retrieval : à la question, on calcule un embedding et on récupère les passages les plus similaires (top‑k), parfois avec un filtre (date, auteur, projet).
Generation : le LLM reçoit la question + les extraits trouvés et rédige une réponse, idéalement avec citations.

À quoi ça sert

Questions/réponses sur une documentation interne à jour.
Assistants de support client avec des réponses conformes aux procédures.
Recherche sémantique et synthèse multi-sources.

Points d’attention

La qualité dépend surtout du découpage, de l’index, du ranking et du prompt. Un mauvais retrieval donne une réponse plausible mais fausse. Des garde-fous (citations, seuils de confiance, fallback) sont souvent nécessaires.

Retour au glossaire

Continuez votre exploration

Outils IADécouvrir les outils

Prompts IAExplorer les prompts

Blog IALire nos articles

RAG (Retrieval-Augmented Generation)

Comment ça fonctionne

À quoi ça sert

Points d’attention

Continuez votre exploration

Autres définitions

RAG (Retrieval-Augmented Generation)

Comment ça fonctionne

À quoi ça sert

Points d’attention

Continuez votre exploration

Autres définitions