Cloud Computing
Fourniture de ressources informatiques (serveurs, stockage) via Internet, indispensable pour les lourds calculs d'IA.
Le cloud computing consiste à louer des ressources informatiques à la demande via Internet, plutôt que d’acheter et maintenir ses propres serveurs. Cela inclut typiquement du calcul (CPU/GPU), du stockage, des bases de données, du réseau et des services managés (Kubernetes, fonctions serverless, etc.). L’intérêt principal est la flexibilité : on peut augmenter ou réduire la capacité en quelques minutes et ne payer que ce qui est consommé.
Comment ça fonctionne
Un fournisseur exploite de grands centres de données et mutualise le matériel entre clients. Vous provisionnez des ressources via une console, une API ou de l’Infrastructure as Code (Terraform). Les usages courants reposent sur :
- IaaS : machines virtuelles, disques, réseaux.
- PaaS : plateformes gérées (bases, pipelines, containers).
- SaaS : applications prêtes à l’emploi (messagerie, CRM).
Pourquoi c’est clé pour l’IA
En IA, l’entraînement et l’inférence exigent souvent des GPU coûteux et des volumes de données importants. Le cloud permet de lancer rapidement des instances GPU, de stocker des datasets, et d’automatiser les workflows (ETL, entraînement, déploiement).
Exemples
- Entraîner un modèle sur des GPU pendant 8 heures, puis tout arrêter.
- Déployer une API de prédiction qui s’auto-adapte au trafic.
- Stocker des embeddings et indexer de la recherche vectorielle via des services managés.