Microsoft redessine sa carte du silicium. Après avoir utilisé votre accélérateur pour la première fois Maia 100 chez TSMC (N5 + CoWoS-S)la société a décidé que Maia 2 naîtrait en Fonderie Intel. Ce n’est pas une anecdote : c’est un mouvement qui a un impact sur les coûts énergétiques, la capacité d’approvisionnement et la géopolitique de l’informatique. Si le nouveau nœud 18A (et son dérivé 18A-P) tient ses promesses, Microsoft aura la possibilité de faire évoluer l’IA sans que sa facture d’électricité ne monte en flèche. Et Intel aura enfin retrouvé sa crédibilité en tant que fondeur tiers pour les charges de travail de haut niveau.
Pourquoi Microsoft fait un pas
Le Maia 100 a montré que Redmond peut concevoir ses propres accélérateurs compétitifs, mais il a également montré clairement le prix à payer pour jouer en première ligne.: Une matrice de 820 mm², 64 Go de HBM2E à 1,8 To/s, 500 Mo de cache L1/L2 et un TDP de 500 W (pic à 700 W). Les performances du tenseur ont accompagné (jusqu’à 3 PetaOPS à 6 bits, 1,5 PetaOPS à 9 bits et 0,8 PetaFLOPS sur BF16), mais la consommation et la pression sur la chaîne CoWoS de TSMC aussi. Microsoft a besoin de davantage de contrôle du « coût par watt » et de certitude en matière de capacité à mesure que Azure AI et Copilot se développent. La diversification avec Intel est donc une démarche commerciale plutôt que marketing.
Ce que promet le 18A/18A-P dans un accélérateur d’IA
La proposition d’Intel combine RibbonFET (son implémentation GAA) et PowerVia (alimentation par l’arrière de la plaquette). La version 18A-P ajoute la deuxième génération des deux, ainsi que des dispositifs, des matériaux et des géométries à bas seuil repensés pour réduire les fuites et une largeur de bande affinée.
En termes pratiques: plus de fréquence utile à même tension, moins de chaleur par opération et plus d’espace disponible pour l’interconnexion et la mémoire. Dans un cluster comprenant des milliers d’accélérateurs, une amélioration de 10 à 15 % des performances par watt libère des mégawatts à l’échelle du centre de données et permet des densités par rack plus ambitieuses sans limitation.
Le rapport qui remet la pièce à sa place
Au milieu de toute cette histoire, la confirmation clé apparaît. Charlie Demerjian (SemiAccurate) assure que Microsoft a déjà commandé Maia 2 à Intel Foundry en 18A ou 18A-Pet que le projet est suffisamment important pour servir de « cas de test » pour le nouveau modèle de fonderie d’Intel.
L’analyste précise que le 18A-P intègre des modifications de seuil, de fuite et de métallisation visant à réduire les performances/W, là où un accélérateur vit ou meurt. Il ne s’agit pas seulement d’un retrait symbolique : si tout se passe bien, Microsoft migrera les générations suivantes (avec des options comme 18A-PT et 14A) vers la même maison.
Ce qui change par rapport au Maia 100
Si 18A-P est conforme, Maia 2 devrait maintenir sa fréquence cible plus longtemps et réduire le statisme lorsque le HBM se remplit ou lorsque le réseau d’interconnexion est sollicité.. L’efficacité thermique ouvre deux portes : faire évoluer les nœuds par rack sans pénaliser une luminosité soutenue et limiter le besoin de solutions de refroidissement extrêmes. Il serait raisonnable de s’attendre à plus de capacité mémoire et à des améliorations du maillage de communication interne, car la latence entre calcul et HBM pèse autant que le TOPS brut.
Que gagne Intel s’il réussit ?
Pour Intel, Maia 2 est un test public. Après des années d’hésitations en 10 nm et 7 nm, atteindre un volume réel dans un accélérateur de premier plan validerait sa stratégie RibbonFET/PowerVia et, surtout, sa promesse de plannings fiables pour les clients externes. Le contrat avec Microsoft fonctionne comme un sceau de confiance pour les autres concepteurs d’IA qui se tournent aujourd’hui vers TSMC par inertie.
Ce que Microsoft gagne si Intel tient ses promesses
Redmond obtient la souveraineté sur le silicium– Moins de dépendance à l’égard de fenêtres CoWoS saturées, des chaînes logistiques plus proches et de la possibilité de co-concevoir des ajustements de processus pour votre architecture. Sur le plan économique, un accélérateur plus efficace réduit les OPEX par modèle déployé. Stratégiquement, cela donne un effet de levier contre NVIDIA et AMD lors de la négociation des prix et de la feuille de route. Et, si le chemin vers 18A-PT/14A se concrétise, Microsoft sera en mesure d’interagir sans réécrire l’intégralité de sa pile logicielle, en maintenant ainsi la continuité dans ses centres de données.
Que regarder
Le premier risque est une performance durable: Si le nœud ne délivre pas les températures et les fuites comme promis, l’avantage est dilué après dix minutes de chargement. Le second est le paquet et l’interconnexion: HBM, substrat et réseaux doivent accompagner pour que le calcul ne se noie pas en mémoire. Le troisième est la rampe de fabrication: les calendriers et les rendements détermineront s’il s’agit de quelques milliers de pièces ou d’un déploiement à l’échelle Azure. Et enfin, logiciels et compilateurs: L’exploitation du puits 18A-P nécessite des chaînes d’outils matures ; Le meilleur transistor ne sert à rien si le stack n’en profite pas.
La commande de Maia 2 auprès d’Intel Foundry n’est pas un changement de fournisseur, c’est un engagement envers l’efficacité comme avantage concurrentiel. Microsoft cherche à réduire le coût par watt à mesure qu’il fait évoluer son cloud IA ; Intel veut prouver que sa technologie est une fois de plus à la hauteur des leaders. Si le 18A-P tient ses promesses, nous verrons des accélérateurs dotés d’une puissance plus soutenue et des centres de données moins liés aux thermiques. Si cela échoue, ce sera une nouvelle occasion manquée pour Intel et un retour à la case départ pour Microsoft. L’ensemble de l’industrie s’intéresse à ce premier lot.