Puce Nvidia Vera : le pari IA à 200 milliards de dollars
La puce Nvidia Vera ouvre un nouveau front dans l’IA d’inférence, avec un marché estimé à 200 milliards de dollars.
Nvidia continue d’afficher des résultats financiers hors norme, mais l’enjeu le plus stratégique ne se limite plus à ses GPU vedettes. La puce Nvidia Vera s’impose désormais comme un élément central de la prochaine phase de croissance du groupe, dans un marché de l’IA qui se déplace progressivement vers l’inférence.
Lors de la présentation de ses derniers résultats trimestriels, Nvidia a annoncé un chiffre d’affaires de 81,62 milliards de dollars, supérieur aux attentes des analystes, ainsi qu’une prévision de 91 milliards de dollars pour le trimestre suivant. Ces chiffres confirment la puissance commerciale de l’entreprise, mais Jensen Huang a surtout insisté sur un nouveau relais : Vera, un processeur central conçu pour accompagner les charges de travail IA de nouvelle génération.
Selon le dirigeant, cette famille de puces ouvre l’accès à un marché estimé à 200 milliards de dollars, distinct du potentiel déjà associé aux plateformes GPU Blackwell et Rubin. Nvidia vise même 20 milliards de dollars de revenus liés à Vera d’ici la fin de l’exercice fiscal, ce qui en ferait l’un des principaux contributeurs de ventes du groupe.
Pourquoi la puce Nvidia Vera devient stratégique
La puce Nvidia Vera n’est pas présentée comme un simple composant complémentaire. Elle marque l’entrée plus offensive de Nvidia sur un terrain où la concurrence se renforce : les processeurs optimisés pour servir des modèles d’IA à grande échelle, rapidement et à coût maîtrisé.
Jusqu’ici, Nvidia a construit sa domination sur l’entraînement des grands modèles, un domaine où ses GPU restent difficiles à concurrencer. Mais l’économie de l’IA évolue. Une fois les modèles entraînés, les entreprises doivent les utiliser en production, parfois pour des millions de requêtes quotidiennes. C’est précisément le domaine de l’inférence.
La plateforme Vera Rubin, attendue plus tard dans l’année, associera le CPU Vera aux GPU Rubin. Nvidia présente Vera comme un processeur pensé pour l’IA agentique, c’est-à-dire des systèmes capables d’exécuter des tâches plus autonomes et complexes. L’annonce officielle de Nvidia décrit cette orientation vers des infrastructures IA plus adaptées aux agents intelligents et aux traitements intensifs en temps réel.
Dans cette logique, Vera doit aider Nvidia à défendre son avance, non seulement dans les centres de données traditionnels, mais aussi dans les clouds spécialisés en IA et les infrastructures à très haut débit.
L’inférence IA, nouveau champ de bataille des puces
Le déplacement du marché vers l’inférence change les rapports de force. Former le modèle le plus puissant reste essentiel, mais l’exploiter efficacement devient tout aussi critique. Les clients veulent réduire la latence, contenir les coûts énergétiques et maximiser le volume de requêtes traitées.
C’est là que Nvidia fait face à une pression croissante. Google, Amazon et Microsoft investissent massivement dans leurs propres puces afin d’optimiser leurs infrastructures IA. Google dispose de ses TPU, Amazon développe notamment Trainium, tandis qu’AMD et Intel cherchent aussi à positionner leurs processeurs sur les charges d’inférence.
Cette concurrence ne signifie pas que Nvidia perd son avantage, mais elle impose une adaptation. Les grands clients du cloud, qui figurent parmi les acheteurs les plus importants de GPU Nvidia, ont intérêt à diversifier leurs solutions et à internaliser une partie de leur silicium.
Les principaux enjeux sont désormais clairs :
- réduire le coût par requête IA ;
- améliorer la vitesse de réponse ;
- optimiser la consommation énergétique ;
- sécuriser l’approvisionnement en composants ;
- éviter une dépendance excessive à un seul fournisseur.
La réponse de Nvidia consiste donc à élargir sa plateforme. Vera ne remplace pas les GPU, mais complète l’architecture pour mieux couvrir l’ensemble du cycle de vie des modèles d’IA.
Un marché de 200 milliards au-delà des GPU
Jensen Huang a souligné un point majeur : le potentiel de Vera serait additionnel aux perspectives déjà associées aux GPU Blackwell et Rubin. Nvidia avait déjà évoqué un marché de 1 000 milliards de dollars lié à ces générations de puces IA entre 2025 et 2027. Avec Vera, l’entreprise revendique un nouveau marché de 200 milliards de dollars.
Cette distinction est importante pour les investisseurs. Elle suggère que Nvidia ne cherche pas seulement à vendre plus de GPU, mais à capter une part plus large de l’infrastructure IA, y compris les composants centraux qui orchestrent les calculs, les flux de données et les charges d’inférence.
Le développement de Vera s’appuie en partie sur des technologies issues de Groq, une entreprise spécialisée dans l’inférence. L’accord de licence évoqué autour de cette technologie aurait représenté environ 17 milliards de dollars. Ce choix illustre la volonté de Nvidia d’accélérer sur un segment où les architectures spécialisées gagnent en visibilité.
Si Vera atteint les objectifs annoncés, Nvidia pourrait renforcer son positionnement comme fournisseur d’infrastructure IA complète, depuis l’entraînement jusqu’au déploiement en production. C’est un élément décisif alors que les usages de l’IA générative passent d’expérimentations à des services intégrés dans les produits, les logiciels et les processus métiers.
La chaîne d’approvisionnement reste le principal risque
Malgré l’ambition affichée, Jensen Huang a reconnu une contrainte majeure : l’offre pourrait ne pas suivre la demande. Le dirigeant a indiqué s’attendre à des tensions d’approvisionnement tout au long du cycle de vie de Vera Rubin.
Cette déclaration est significative. Elle montre que Nvidia anticipe une forte demande, mais aussi que les goulots d’étranglement restent nombreux dans les semi-conducteurs avancés. Les puces mémoire, les capacités de fabrication et les composants associés aux centres de données demeurent des points sensibles.
Pour limiter ces risques, Nvidia a augmenté fortement ses engagements d’approvisionnement. Ceux-ci sont passés de 95,2 milliards de dollars à 119 milliards de dollars en un trimestre. Ce bond traduit à la fois la confiance dans la demande future et la nécessité de sécuriser les capacités en amont.
En parallèle, l’entreprise a annoncé un programme de rachat d’actions de 80 milliards de dollars et une hausse de son dividende trimestriel à 25 cents par action, contre 1 cent auparavant. Ces décisions envoient un signal de solidité financière, même si elles coexistent avec des tensions industrielles très concrètes.
Ce que les investisseurs surveillent maintenant
Malgré des résultats supérieurs aux attentes, l’action Nvidia a reculé de 1,6 % dans les échanges prolongés après l’annonce. Cette réaction illustre un changement d’état d’esprit : battre les prévisions ne suffit plus nécessairement lorsque le marché intègre déjà une croissance exceptionnelle.
La question centrale devient celle de la durabilité. Les investisseurs veulent savoir si la construction massive d’infrastructures IA se poursuivra en 2027 et 2028, surtout si l’inférence devient le principal moteur de dépenses et si les alternatives propriétaires des géants du cloud gagnent en efficacité.
Jensen Huang défend une thèse claire : la demande ne dépend plus uniquement des hyperscalers traditionnels. Une nouvelle catégorie de clients cloud spécialisés dans l’IA dépenserait désormais à un niveau comparable, avec une croissance plus rapide trimestre après trimestre.
Dans ce contexte, Vera sert de preuve stratégique. Si Nvidia parvient à livrer suffisamment de puces, à convaincre sur les performances d’inférence et à maintenir son écosystème logiciel, l’entreprise pourrait consolider son rôle au cœur de l’IA industrielle.
Conclusion
La puce Nvidia Vera représente bien plus qu’une annonce technique. Elle incarne la volonté de Nvidia d’ouvrir un second front dans l’IA, au moment où l’inférence devient un enjeu économique majeur.
Avec un marché potentiel estimé à 200 milliards de dollars, Vera peut renforcer la trajectoire de croissance du groupe. Mais son succès dépendra autant de la demande que de la capacité de Nvidia à sécuriser sa chaîne d’approvisionnement face à une concurrence de plus en plus structurée.
