Température
Paramètre contrôlant la créativité et l'aléatoire des réponses générées par un LLM.
La température est un réglage qui influence la part de hasard dans le choix des mots lors de la génération. Elle ne change pas les connaissances du modèle, mais la manière dont il sélectionne le prochain token. Plus elle est élevée, plus le modèle explore des options moins probables, ce qui augmente la variété des formulations.
Comment ça fonctionne
Un LLM produit une distribution de probabilités sur les tokens possibles. La température rééchelonne ces probabilités :
- Température basse : la distribution devient plus “piquée” → le modèle choisit souvent les tokens les plus probables.
- Température haute : la distribution s’aplatit → des tokens moins probables peuvent être choisis.
À température très basse, les réponses sont plus stables, parfois répétitives. À température très élevée, elles peuvent devenir incohérentes ou factuellement risquées.
À quoi ça sert
- Rédaction créative (idéation, storytelling, variations de style) : température plutôt haute.
- Tâches précises (résumé fidèle, extraction, QA factuelle, code) : température plutôt basse.
Exemples
- Générer 10 slogans différents :
temperature = 0.8–1.2 - Produire une réponse reproductible et prudente :
temperature = 0–0.3
À noter : la température interagit souvent avec d’autres réglages comme top-p (nucleus sampling) et le seed (reproductibilité).