Apprentissage Supervisé
Entraînement d'un modèle sur un ensemble de données étiquetées (où la réponse attendue est connue).
L’apprentissage supervisé consiste à apprendre à un modèle à prédire une sortie à partir d’exemples où la bonne réponse est déjà fournie. Chaque donnée d’entraînement est composée d’entrées (features) et d’une étiquette (label). L’objectif est de généraliser : bien répondre sur de nouvelles données jamais vues.
Comment ça fonctionne
On divise souvent les données en jeu d’entraînement et jeu de test (voire validation). Le modèle produit une prédiction, puis une fonction de perte mesure l’écart entre la prédiction et l’étiquette. Un algorithme d’optimisation (souvent la descente de gradient) ajuste les paramètres pour minimiser cette perte. On suit des métriques comme l’accuracy, le F1-score (classification) ou le MAE/MSE (régression), et on surveille le surapprentissage (overfitting).
À quoi ça sert
C’est la base de nombreux usages industriels quand on dispose d’historiques étiquetés : automatiser des décisions, classer, détecter ou estimer des valeurs.
Exemples
- Classification : spam vs non-spam, fraude vs légitime, diagnostic à partir d’images médicales.
- Régression : prédire un prix immobilier, une demande, un temps de livraison.
- Modèles courants : régression logistique, SVM, arbres/forêts, réseaux de neurones.