GPU (Processeur Graphique)
Puce informatique très efficace pour le calcul parallèle, devenue le standard pour l'entraînement des modèles d'IA.
Un GPU (processeur graphique) est un processeur conçu à l’origine pour afficher des images, mais optimisé pour exécuter beaucoup d’opérations similaires en même temps. Contrairement au CPU, qui privilégie quelques cœurs très polyvalents, un GPU embarque des milliers de cœurs plus simples capables de traiter en parallèle de grands tableaux de données.
Comment ça fonctionne
Les calculs sont découpés en petits “threads” exécutés simultanément. Cette approche est idéale pour les opérations mathématiques répétitives comme les multiplications de matrices (au cœur du deep learning). Les frameworks IA (PyTorch, TensorFlow) s’appuient sur des bibliothèques et des runtimes (souvent CUDA côté NVIDIA, ou ROCm côté AMD) pour envoyer les tenseurs sur la mémoire du GPU et planifier les kernels de calcul.
Pourquoi c’est central en IA
L’entraînement et l’inférence de modèles reposent sur des opérations massivement parallélisables. Un GPU accélère fortement :
- l’entraînement (backpropagation, convolutions, attention),
- l’inférence à grande échelle,
- le traitement batch de données.
Exemples concrets
- Entraîner un modèle de vision sur des millions d’images.
- Servir un LLM avec faible latence via des lots de requêtes.
- Accélérer des simulations ou du calcul scientifique (HPC).