Définition
Ensemble de test (Test set)
Données mises de côté et utilisées à la toute fin pour évaluer la performance finale et objective du modèle.
Publié le 4 mars 2026par ZoneIA
Un ensemble de test est un jeu de données “verrouillé” : il n’est ni utilisé pour entraîner le modèle, ni pour choisir ses hyperparamètres. Son objectif est de fournir une estimation impartiale des performances sur des données inédites, au plus proche de l’usage réel.
Comment ça fonctionne
On sépare généralement les données en trois parties :
- Entraînement (train) : le modèle apprend.
- Validation (val) : on ajuste les hyperparamètres, on choisit une version du modèle, on surveille le surapprentissage.
- Test : on évalue une seule fois, à la fin, le modèle final.
Cette séparation évite de “tricher” involontairement. Si l’on consulte le test set trop souvent (par exemple en itérant jusqu’à obtenir un bon score), on finit par suradapter le modèle aux particularités du test, et l’évaluation n’est plus fiable.
À quoi ça sert
- Comparer des modèles ou des approches sur une base commune.
- Mesurer la généralisation (accuracy, F1, AUC, BLEU, etc.).
- Documenter une performance reproductible dans un rapport ou une fiche modèle.
Bonnes pratiques
- Garder le test set représentatif des données en production.
- Éviter toute fuite de données (doublons, features calculées avec des infos futures).
- Pour des données limitées, utiliser la validation croisée, tout en conservant un test set final.