Epoch (Époque)
Un passage complet du jeu de données d'entraînement à travers l'algorithme d'apprentissage.
Une époque correspond à un cycle d’entraînement où le modèle voit tous les exemples du jeu de données une fois. Elle sert à mesurer l’avancement de l’apprentissage : après chaque époque, on peut évaluer si la performance s’améliore (sur l’entraînement et, idéalement, sur un jeu de validation).
Comment ça fonctionne
En pratique, le jeu de données est souvent découpé en mini-lots (batches). Pendant une époque, le modèle traite chaque batch successivement, calcule une erreur (loss), puis met à jour ses paramètres via la rétropropagation et un optimiseur (SGD, Adam, etc.).
Nombre d’itérations par époque ≈ taille_dataset / batch_size.
Pourquoi c’est important
- Trop peu d’époques : le modèle n’a pas assez appris (sous-apprentissage).
- Trop d’époques : le modèle peut mémoriser le jeu d’entraînement et généraliser moins bien (surapprentissage).
On choisit donc le nombre d’époques comme un hyperparamètre, souvent avec des techniques comme l’early stopping (arrêt anticipé) pour stopper quand la validation n’améliore plus.
Exemple concret
Sur 100 000 images avec un batch size de 100, une époque représente 1 000 itérations. En entraînant 10 époques, le modèle aura vu chaque image 10 fois (avec éventuellement un mélange/shuffle entre époques).