Nvidia a profité de l’édition de Chips chauds 2025 Pour mettre sur la table l’un de ses développements les plus ambitieux: le GB10 Grace Blackwellun superchip compact conçu pour concentrer une bonne partie de la puissance d’un centre de données sur quelque chose qui s’intègre dans une station de travail de bureau. L’idée est simple, mais énergique: apporter une capacité de calcul extrême au format de bureau, sans avoir besoin d’énormes racks ou de consommation débordante.
GB10 est un Conception multimatriceoù ils vivent dans un même encapsulé la partie du CPU et la partie GPU. La puce est fabriquée dans le processus TSMC de 3 nm avec un emballage 2.5D, une solution qui vous permet de gravir les performances sans feu ni énergie.
CPU Grace avec timbre Mediatak
La partie CPU vient de la main de Mediatak, qui a collaboré avec Nvidia dans cette architecture. En nombre, nous parlons de 20 bras V9.2 noyauxdivisé en deux dix clusters. Chaque groupe est basé sur 16 Mo de cache L3 partagé, ce qui ajoute un total de 32 Mo, tandis que chaque noyau maintient son propre cache L2 privé.
La mémoire joue également un rôle clé: Le sous-système est composé d’un bus LPDDR5x-9400 256 bitscapable de gérer jusqu’à 128 Go de capacité avec une bande passante brute d’environ 301 Go / s. Cela garantit que le CPU et le GPU ont un flux suffisant pour des charges lourdes sans échouer dans le transfert de données.
Quant à la connectivité, le CPU concentre les E / S à grande vitessetandis que le stockage et les périphériques sont canalisés via PCIe. En fait, la configuration elle-même comprend un lien PCIE GEN 5 X8 pour la carte réseau ConnectX-7permettant un scénario multi-unités avec un réseau de grande capacité.
Blackwell GPU au format réduit
Côté graphique, la matrice correspond au Famille Blackwelladapté à un format de consommation faible et à une taille compacte. Malgré cette réduction, les chiffres sont toujours frappants: Jusqu’à 31 téraflops en FP32 et environ 1000 sommets Lorsque le format de précision réduit NVFP4 est utilisé, développé par le NVIDIA lui-même pour les charges d’IA.
Le GPU intègre également un cache L2 de 24 Moqui non seulement prend en charge les calculs graphiques, mais peut également fonctionner comme un niveau de cache visible pour le CPU. Cela génère une hiérarchie de mémoire cohérente entre les deux matrices, réduisant la dépendance des copies intermédiaires et gagnant en efficacité.

Le lien C2C entre CPU et GPU atteint une bande passante globale d’environ 600 Go / sce qui permet à la communication entre les deux parties d’être fluide et avec une faible latence. Tout cela dans un package qui se déplace autour des 140 W de TDP, une figure qui, bien qu’elle ne soit pas modeste, est surprenante pour le niveau d’intégration qu’il offre.
Comme si cela ne suffisait pas, la puce envisage également plusieurs sorties vidéo, combinant DisplayPort en mode alternatif et HDMI 2.1Aainsi que des options de sécurité et de virtualisation conçues pour les charges professionnelles.
DGX Spark, le premier arrêt
Avec l’annonce de la puce, Nvidia a présenté le Station de travail DGX Sparkune équipe conçue pour donner un accès direct à l’écosystème DGX depuis le bureau. L’étincelle exécute les bases DGX et la pile Nvidia localement, mais vous permet également de gravir les travaux pour terminer les systèmes DGX ou même le nuage, selon les besoins. Le prix de référence de ce système commence environ 3 999 $ (environ 3 450 $).

Façon de la consommation: à terme n1 / n1x
Au-delà du domaine professionnel, le plus intéressant du GB10 est ce qui s’ouvre en avant. Cette superchip sert de base au futur SOC N1 / N1x de consommation, qui, selon les rumeurs, conservera la philosophie de combiner la grâce du processeur et le GPU Blackwell dans une seule puce.
La puissance indiquée par le GB10 suggère qu’une configuration réduite pourrait être parfaitement valable pour les ordinateurs portables grand publicoffrant des capacités de l’IA et des graphiques qui jusqu’à présent semblaient réservés aux stations de travail.
Nvidia GB10 Grace Blackwell est un exemple clair de l’endroit où l’industrie va: plus d’intégration, une bande passante plus partagée et moins de barrières entre le processeur et le GPU, le tout dans un format compact et avec une consommation serrée pour ce qu’elle offre. Hot Chips 2025 a été le stade pour indiquer clairement: l’avenir des puces ne distingue plus tant entre le bureau et le centre de données.