Ensemble de validation
Données utilisées pendant l'entraînement pour évaluer le modèle et ajuster ses hyperparamètres.
Un ensemble de validation est un sous-ensemble de données séparé du jeu d’entraînement. Il sert à mesurer, pendant le développement, si le modèle généralise correctement sur des exemples qu’il n’a pas utilisés pour apprendre directement.
Comment ça fonctionne
On découpe généralement les données en trois parties : entraînement, validation et test. Le modèle ajuste ses poids sur l’entraînement. Puis on calcule une métrique (accuracy, loss, F1, perplexité, etc.) sur la validation. Cette mesure guide des choix comme :
- le taux d’apprentissage, la régularisation, la taille du modèle,
- le nombre d’époques (via early stopping),
- le seuil de décision, le type de features, etc.
Important : la validation est utilisée à répétition. À force d’itérer, on peut « sur-optimiser » pour ce jeu, ce qui le rend moins représentatif.
À quoi ça sert
- Détecter le surapprentissage : performance élevée en entraînement mais faible en validation.
- Comparer des variantes de modèles et d’hyperparamètres.
- Choisir un modèle final avant l’évaluation définitive.
Exemple concret
Dans un split 80/10/10, on entraîne sur 80%, on choisit l’hyperparamètre qui maximise la F1 sur 10% (validation), puis on rapporte le score final sur les 10% restants (test).