SVM (Machine à Vecteurs de Support)
Algorithme de classification très performant qui cherche à trouver un "hyperplan" séparant au mieux les données.
Une SVM est un modèle supervisé qui sépare des données en classes en construisant une frontière de décision. L’idée centrale est de choisir l’hyperplan qui maximise la marge, c’est‑à‑dire la distance entre la frontière et les exemples les plus proches. Ces exemples “critiques” s’appellent les vecteurs de support : ils suffisent en grande partie à définir la séparation.
Comment ça fonctionne
Pour des données linéairement séparables, la SVM cherche la meilleure séparation possible. Quand les classes se chevauchent, on utilise une marge souple (paramètre C) qui tolère certaines erreurs pour mieux généraliser. Pour des séparations non linéaires, la SVM peut appliquer des kernels (RBF, polynomial, etc.) : ils projettent implicitement les données dans un espace de dimension plus élevée où une séparation linéaire devient possible.
À quoi ça sert
Les SVM sont efficaces sur des jeux de données de taille moyenne et en haute dimension (ex. texte), avec souvent de bonnes performances même avec peu d’exemples.
Exemples d’usage
- Classification de spam / non‑spam (features TF‑IDF).
- Détection de fraude ou d’anomalies (variante One‑Class SVM).
- Classification d’images avec des descripteurs (HOG, SIFT) avant l’ère du deep learning.