Arbre de Décision
Modèle d'apprentissage supervisé sous forme d'arbre, où chaque nœud représente un test sur un attribut.
Un arbre de décision est un modèle de classification ou de régression qui prend des décisions en enchaînant des règles simples. Il ressemble à un organigramme : on part de la racine, on répond à des questions successives, puis on arrive à une feuille qui produit la prédiction (une classe ou une valeur).
Comment ça fonctionne
Lors de l’entraînement, l’algorithme cherche, à chaque nœud, le meilleur attribut (et éventuellement un seuil) pour séparer les données en sous-groupes plus « purs ». Cette sélection s’appuie sur des critères comme l’impureté de Gini, l’entropie (gain d’information) ou la réduction de variance en régression. Le processus se répète jusqu’à atteindre un arrêt (profondeur maximale, nombre minimal d’exemples, etc.). Pour éviter le surapprentissage, on utilise souvent le pruning (élagage) ou des contraintes de complexité.
À quoi ça sert
- Produire des modèles interprétables (règles lisibles).
- Gérer des données numériques et catégorielles avec peu de préparation.
- Servir de brique de base à des méthodes plus robustes comme les Random Forests et le Gradient Boosting.
Exemples
- Détecter un risque de churn : “si ancienneté < 3 mois et usage faible → risque élevé”.
- Estimer un prix (régression) selon surface, localisation et état du bien.