LLM (Grand Modèle Linguistique)
Modèle de Deep Learning entraîné sur des quantités massives de texte pour comprendre et générer du langage.
Un LLM est un réseau de neurones conçu pour manipuler du texte : il peut prédire la suite la plus probable d’une séquence (des “tokens”, souvent des morceaux de mots). En apprenant ces régularités sur de très grands corpus, il acquiert une capacité à produire du langage cohérent et à répondre à des consignes.
Comment ça fonctionne
La plupart des LLM modernes reposent sur l’architecture Transformer. Pendant l’entraînement, le modèle ajuste des milliards de paramètres pour minimiser l’erreur de prédiction du token suivant. Ensuite, lors de l’inférence, il génère une réponse token par token, influencée par le contexte fourni (prompt) et des réglages comme la température (plus ou moins de créativité).
À quoi ça sert
Les LLM sont utilisés pour :
- Assistants conversationnels et support client
- Rédaction, résumé, traduction, reformulation
- Extraction d’information et classification de textes
- Aide au développement (explications, génération de code, tests)
Points d’attention
Un LLM peut halluciner (réponses plausibles mais fausses), refléter des biais des données, et ses performances dépendent fortement du prompt et des données fournies. Pour des usages fiables, on combine souvent LLM et sources externes (ex. RAG), avec des garde-fous et de l’évaluation.