Modèle de Fondation
Vaste modèle d'IA entraîné sur un large éventail de données non étiquetées, adaptable à de nombreuses tâches.
Un modèle de fondation est un modèle généraliste (souvent de grande taille) appris à partir de quantités massives de données brutes : texte, images, audio, code, etc. L’objectif n’est pas de résoudre une tâche unique, mais d’acquérir des représentations et des connaissances réutilisables dans de nombreux contextes.
Comment ça fonctionne
L’entraînement initial se fait généralement par apprentissage auto-supervisé : le modèle prédit une partie manquante ou future des données (ex. prochain mot, région masquée d’une image). Cette étape coûteuse produit un modèle « de base ». Ensuite, on l’adapte via :
- fine-tuning (réentraînement sur un jeu de données ciblé),
- prompting (instructions en entrée),
- RAG (connexion à des documents externes),
- alignement (ex. RLHF) pour mieux suivre des consignes et réduire certains comportements indésirables.
À quoi ça sert
Il sert de brique commune pour construire rapidement des applications : assistance à l’écriture, recherche sémantique, extraction d’informations, classification, génération de code, ou analyse d’images. Cela réduit le besoin d’entraîner un modèle spécialisé à partir de zéro.
Exemples concrets
Chatbots métier, résumé de tickets support, détection d’entités dans des contrats, copilotes de développement, ou moteurs de recherche augmentés par IA.