Définition
Feature Engineering
Processus de sélection, modification ou création de variables (features) pour améliorer la performance d'un modèle.
Publié le 4 mars 2026par ZoneIA
Le feature engineering consiste à transformer des données brutes en variables plus pertinentes pour un modèle de machine learning. Même avec un algorithme performant, la qualité des features influence fortement la précision, la robustesse et la capacité de généralisation. L’objectif est de rendre l’information utile plus « lisible » par le modèle, tout en réduisant le bruit.
Comment ça fonctionne
On combine généralement trois types d’actions :
- Sélection : garder les variables informatives, retirer celles qui sont redondantes ou peu utiles (corrélation, importance de variables, tests statistiques).
- Transformation : normalisation/standardisation, encodage des catégories (one-hot, target encoding), traitement des valeurs manquantes, réduction de dimension.
- Création : dériver de nouvelles variables à partir d’autres (ratios, agrégations, interactions, lags temporels, variables cycliques pour heures/jours).
À quoi ça sert
- Améliorer les performances sans changer de modèle.
- Réduire le surapprentissage en simplifiant ou régularisant implicitement les entrées.
- Accélérer l’entraînement et faciliter l’interprétation.
Exemples
- Convertir une date en jour de semaine, mois, saison.
- Transformer du texte en TF-IDF ou en embeddings.
- En détection de fraude : créer le montant moyen par utilisateur sur 7 jours ou le nombre de transactions récentes.