Alibaba mise sur les puces IA pour agents autonomes en Chine
Alibaba dévoile des puces IA pour agents et une feuille de route qui montre sa volonté de bâtir une pile IA complète en Chine.
Les puces IA pour agents deviennent un nouveau terrain stratégique dans la course à l’intelligence artificielle. Avec le Zhenwu M890, Alibaba ne cherche pas seulement à améliorer ses performances de calcul. Le groupe chinois positionne son matériel, ses modèles et son cloud autour d’un usage précis : les agents autonomes capables d’exécuter des tâches longues, coordonnées et complexes.
Cette annonce marque une évolution importante. Jusqu’ici, l’attention portait surtout sur l’entraînement des grands modèles ou l’inférence classique. Alibaba met désormais l’accent sur des charges de travail différentes, où la mémoire, la continuité du contexte et la communication entre modèles deviennent aussi critiques que la puissance brute.
Des puces IA pour agents plutôt que pour l’inférence classique
Le Zhenwu M890 a été conçu par T-Head, la filiale semi-conducteurs d’Alibaba. Selon les indications de l’entreprise, ce nouveau processeur offrirait des performances environ trois fois supérieures à celles du Zhenwu 810E, son prédécesseur.
Mais l’élément le plus significatif n’est pas seulement ce gain. Le M890 vise spécifiquement les agents IA, c’est-à-dire des systèmes logiciels capables de conserver de longs contextes, d’interagir avec d’autres modèles en temps réel et de mener des opérations en plusieurs étapes avec une intervention humaine limitée.
Ces besoins diffèrent fortement de ceux des puces d’inférence traditionnelles. Un agent autonome doit souvent maintenir une compréhension étendue d’un projet, orchestrer plusieurs actions et gérer des échanges entre composants IA. Cela impose une forte bande passante mémoire et une communication efficace entre modèles.
En orientant son architecture vers ces usages, Alibaba montre où il pense que la demande entreprise va se déplacer. L’objectif n’est plus uniquement de répondre aux requêtes d’un chatbot, mais de soutenir des systèmes capables de travailler sur la durée, dans des environnements métiers complexes.
Une feuille de route qui installe Alibaba dans la durée
Le Zhenwu M890 s’inscrit dans une feuille de route pluriannuelle. Alibaba prévoit de lancer le V900 au troisième trimestre 2027, avec un nouveau gain de performance attendu d’environ trois fois. Un autre processeur, le J900, est ensuite prévu pour le troisième trimestre 2028.
Cette cadence traduit une stratégie industrielle. Alibaba ne présente pas un composant isolé, mais une trajectoire de développement continue. Cette logique rappelle les cycles réguliers adoptés par les grands acteurs des accélérateurs IA pour maintenir leur avance technologique.
Le parallèle avec Huawei est également notable. Huawei a déjà présenté une feuille de route similaire pour sa gamme Ascend. Dans les deux cas, les groupes technologiques chinois semblent considérer que la dépendance au silicium étranger représente un risque structurel, même si certaines restrictions internationales devaient évoluer.
Cette approche transforme les semi-conducteurs en compétence stratégique de long terme. Il ne s’agit plus simplement d’acheter des puces disponibles sur le marché, mais de maîtriser une partie essentielle de l’infrastructure IA.
Alibaba a d’ailleurs annoncé l’an dernier un engagement de plus de 380 milliards de yuans, soit environ 53 milliards de dollars, dans le cloud et les infrastructures IA sur trois ans. Le M890 et ses successeurs apparaissent comme l’un des résultats concrets de cet investissement massif.
Un déploiement déjà ancré dans les entreprises
T-Head affirme avoir livré plus de 560 000 unités Zhenwu à ce jour. Plus de 400 clients externes, répartis dans 20 secteurs, utiliseraient déjà ces puces. Parmi eux figurent notamment des constructeurs automobiles et des entreprises de services financiers.
Ce point est important, car il montre que la technologie d’Alibaba ne se limite pas à un prototype de laboratoire. Le groupe dispose déjà d’un volume de déploiement significatif, qui peut lui fournir des retours d’usage réels avant la montée en puissance du M890.
Le nouveau processeur sera proposé aux entreprises chinoises via Bailian, la plateforme domestique de modèles d’Alibaba Cloud. Il sera intégré au système serveur Panjiu AL128, capable d’empiler 128 accélérateurs M890 dans un même rack.
Cette configuration vise clairement des usages d’entreprise exigeants. Les secteurs qui automatisent des workflows complexes, analysent de grands volumes d’informations ou développent des assistants métiers avancés pourraient être les premiers concernés.
Les charges de travail visées incluent notamment :
- l’exécution d’agents IA sur de longues périodes ;
- la coordination de plusieurs modèles spécialisés ;
- l’automatisation de processus métier en plusieurs étapes ;
- l’analyse continue de contextes étendus ;
- le support d’applications IA dans le cloud privé ou public.
Qwen 3.7-Max complète la stratégie matérielle
Alibaba n’a pas seulement présenté une puce. Le groupe a aussi annoncé Qwen 3.7-Max, la nouvelle version de son grand modèle de langage. Ce modèle est décrit comme optimisé pour le codage avancé et les tâches agentiques de longue durée.
L’entreprise indique que Qwen 3.7-Max peut fonctionner jusqu’à 35 heures sans dégradation de performance. Une telle caractéristique prend tout son sens dans le contexte des agents autonomes. Elle suggère une volonté de soutenir des opérations continues plutôt que des interactions ponctuelles.
Le lancement simultané du M890 et de Qwen 3.7-Max n’est donc pas anodin. Alibaba aligne son matériel et son logiciel sur la même catégorie d’usage. La puce répond aux besoins d’exécution, tandis que le modèle vise les scénarios où l’IA doit coder, raisonner et agir sur une période prolongée.
Cette synchronisation donne à Alibaba une base pour proposer une plateforme plus cohérente aux entreprises. Le client ne choisit pas seulement une puce, un modèle ou un service cloud. Il accède à un ensemble pensé pour fonctionner de manière intégrée.
Une pile IA intégrée pour réduire les dépendances
La stratégie d’Alibaba repose sur une pile intégrée : les puces Zhenwu développées par T-Head, les modèles Qwen et la distribution via Alibaba Cloud et Bailian. Chaque brique renforce les autres.
Cette logique peut devenir un avantage compétitif. En contrôlant davantage de composants, Alibaba peut optimiser les performances, ajuster ses modèles à son matériel et proposer une expérience plus fermée mais aussi plus prévisible aux entreprises clientes.
Elle répond aussi à un enjeu géopolitique et industriel. Les restrictions américaines sur certaines technologies avancées ont accéléré la recherche d’alternatives nationales en Chine. Toutefois, la démarche d’Alibaba semble désormais dépasser la simple contrainte réglementaire.
À partir du moment où une entreprise planifie plusieurs générations de processeurs, aligne ses modèles et organise son cloud autour de cette architecture, il ne s’agit plus seulement de contourner un blocage. Il s’agit de bâtir une autonomie technologique durable.
Conclusion : un signal fort pour l’IA d’entreprise
Avec le Zhenwu M890, Alibaba envoie un message clair : les agents IA pourraient devenir l’un des moteurs majeurs de la demande en calcul dans les prochaines années. La performance reste importante, mais elle ne suffit plus. Les entreprises auront besoin d’infrastructures capables de gérer des tâches longues, coordonnées et autonomes.
La feuille de route jusqu’en 2028, les volumes déjà livrés et l’arrivée de Qwen 3.7-Max montrent une ambition structurée. Alibaba ne cherche pas seulement à participer à la course aux puces IA. Le groupe veut redéfinir cette course autour des agents autonomes, avec une pile complète allant du silicium au cloud.
