Détection d'Objets
Tâche consistant à identifier et localiser des objets spécifiques au sein d'une image.
La détection d’objets est une tâche de vision par ordinateur qui combine reconnaissance (quel objet ?) et localisation (où est-il ?) dans une même image. Contrairement à la simple classification d’image, elle ne renvoie pas une seule étiquette globale, mais une liste d’objets détectés avec leurs positions.
Comment ça fonctionne
Un modèle reçoit une image et prédit, pour chaque objet trouvé :
- une classe (ex. “personne”, “voiture”),
- une boîte englobante (bounding box) : coordonnées du rectangle autour de l’objet,
- un score de confiance.
Les modèles modernes (ex. YOLO, Faster R-CNN, SSD, DETR) apprennent à partir d’images annotées avec ces boîtes. L’entraînement optimise une combinaison de pertes : classification (bonne catégorie) et régression (boîte bien alignée). En sortie, une étape de filtrage (souvent NMS, non-maximum suppression) élimine les doublons.
À quoi ça sert
- Véhicules autonomes : piétons, panneaux, obstacles.
- Surveillance/retail : comptage, détection d’intrusion, analyse de rayons.
- Industrie : contrôle qualité, tri, détection de défauts.
- Santé : repérage de régions d’intérêt sur des images médicales.
Variante proche
La segmentation va plus loin en donnant la forme précise (masque pixel par pixel) au lieu d’un simple rectangle.