Segmentation d'Image
Division d'une image en plusieurs segments au niveau du pixel pour simplifier son analyse.
La segmentation d’image consiste à attribuer une étiquette à chaque pixel afin de regrouper les zones qui appartiennent au même objet ou à la même région (route, ciel, tumeur, etc.). Contrairement à une simple détection d’objets (qui produit des boîtes), elle fournit une carte dense de l’image, plus précise pour mesurer des surfaces ou suivre des contours.
Comment ça fonctionne
En vision par ordinateur moderne, on utilise souvent des réseaux de neurones convolutionnels de type encodeur–décodeur (ex. U-Net, DeepLab). Le modèle apprend à transformer l’image en une représentation compacte, puis à reconstruire un masque à la taille d’origine. L’entraînement se fait avec des images annotées pixel par pixel et une fonction de perte adaptée (cross-entropy, Dice loss), parfois complétée par des techniques d’augmentation de données.
Types courants
- Segmentation sémantique : chaque pixel reçoit une classe (tous les “voitures” partagent la même étiquette).
- Segmentation d’instance : distingue chaque objet individuellement (voiture #1, #2…).
- Segmentation panoptique : combine les deux approches.
Usages concrets
Conduite autonome (chaussée/piétons), imagerie médicale (délimitation de lésions), industrie (contrôle qualité), cartographie (bâtiments, végétation), montage photo (détourage).