Classification
Tâche d'apprentissage supervisé où l'algorithme doit attribuer une catégorie (étiquette) à une nouvelle donnée.
La classification consiste à prédire une étiquette discrète (classe) à partir d’un ensemble de caractéristiques (features). On l’oppose souvent à la régression, qui prédit une valeur continue. Les classes peuvent être binaires (oui/non) ou multi-classes (plusieurs catégories), et parfois multi-label (plusieurs étiquettes possibles pour une même donnée).
Comment ça fonctionne
On entraîne un modèle sur des exemples annotés : chaque entrée (texte, image, signal…) est associée à la bonne classe. Le modèle apprend une fonction qui relie les features à une probabilité par classe, puis choisit la plus probable (ou un ensemble selon un seuil). Selon les cas, on utilise des algorithmes comme la régression logistique, les arbres de décision, les SVM ou des réseaux de neurones.
À quoi ça sert
La classification sert à automatiser la prise de décision et le tri : filtrer des emails, détecter des anomalies, catégoriser des documents, reconnaître des objets, estimer un risque, etc.
Exemples concrets
- Spam vs non-spam à partir du contenu d’un email.
- Sentiment d’un avis : positif / neutre / négatif.
- Catégorisation d’images : “chat”, “chien”, “voiture”.
On évalue souvent la performance avec l’accuracy, la précision, le rappel et la matrice de confusion.