Aller au contenu principal
Logo ZoneIA
ZoneIA
Outils IAPromptsDealsBlogGlossaireSoumettre un outil IA
Logo ZoneIA
ZoneIA

La plateforme de référence francophone pour découvrir et comparer les outils d'Intelligence Artificielle.

Liens rapides
  • Tous les outils→
  • Deals & Promos→
  • Top outils→
  • Blog & Actualités→
  • Glossaire IA→
  • Mentions légales→
  • Confidentialité→

© 2026 ZoneIA. Tous droits réservés.

Logo ZoneIA
ZoneIA

La plateforme de référence francophone pour découvrir et comparer les outils d'Intelligence Artificielle.

Explorer

  • Tous les outils
  • Deals & Promos
  • Top outils
  • Soumettre un outil

Ressources

  • Blog & Actualités
  • Glossaire IA
  • Contact

Légal

  • Mentions légales
  • Confidentialité

© 2026 ZoneIA. Tous droits réservés.

Fait avec en France pour la communauté francophone

  1. Accueil
  2. Glossaire
  3. TF-IDF
Définition

TF-IDF

Mesure statistique évaluant l'importance d'un mot dans un document par rapport à une collection de documents.

Publié le 4 mars 2026par ZoneIA

TF‑IDF (Term Frequency–Inverse Document Frequency) est une pondération classique en recherche d’information et en NLP pour transformer du texte en valeurs numériques. L’idée est simple : un terme est jugé important s’il apparaît souvent dans un document, mais pas partout dans le corpus.

Comment ça fonctionne

  • TF (term frequency) mesure la fréquence d’un mot dans un document (souvent normalisée par la longueur du document).
  • IDF (inverse document frequency) réduit le poids des mots fréquents dans de nombreux documents (ex. “le”, “et”). Typiquement :
    idf(t) = log(N / (df(t) + 1)), où N est le nombre de documents et df(t) le nombre de documents contenant le terme.
  • TF‑IDF = TF × IDF : un mot obtient un score élevé s’il est fréquent dans un document, mais rare dans le reste du corpus.

À quoi ça sert

  • Indexer et rechercher des documents (scoring de pertinence).
  • Classifier ou regrouper des textes (SVM, régression logistique, clustering) via des vecteurs “sac de mots”.
  • Extraire des mots-clés caractéristiques d’un document.

Exemple

Dans un corpus d’articles, “transformer” aura souvent un TF‑IDF élevé dans un article sur les LLM, alors que “données” peut être moins discriminant car présent partout.

Retour au glossaire

Continuez votre exploration

Outils IADécouvrir les outils
Prompts IAExplorer les prompts
Blog IALire nos articles

Sommaire

  • Comment ça fonctionne
  • À quoi ça sert
  • Exemple

Autres définitions

  • AGI (Intelligence Artificielle Générale)
  • ANI (Intelligence Artificielle Étroite)
  • API (Interface de Programmation d'Application)
  • ASI (Superintelligence Artificielle)
  • Agent Autonome
  • Algorithme
  • Alignement de l'IA (Alignment)
Voir tout le glossaire

Articles récents

  • Claude Opus 4.8 : Anthropic muscle le codage IA agentique
  • Google Pay prépare les paiements des agents IA autonomes
  • Demand Gen : Google mise sur l’IA pour remplacer Display
Voir le blog

Explorer

Annuaire des outils IABibliothèque de prompts

Autres définitions

AGI (Intelligence Artificielle Générale)ANI (Intelligence Artificielle Étroite)API (Interface de Programmation d'Application)ASI (Superintelligence Artificielle)Agent AutonomeAlgorithme
Voir tout le glossaire