Il s’agit de NVIDIA Vera Rubin : performances 5x en matière d’inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs

NVIDIA a dévoilé les détails de sa prochaine plateforme NVIDIA Vera Rubin, qui est actuellement en production et est composé de 6 puces de nouvelle génération qui travaillent ensemble pour créer un système de racks et de serveurs haute puissance pour la nouvelle génération de systèmes d’intelligence artificielle.

Parmi ces 6 puces se trouvent évidemment les nouveaux processeurs NVIDIA Vera avec leur propre architecture Olympus et les nouveaux GPU Rubin avec des performances jusqu’à 5 fois supérieures à celles de Blackwell dans les tâches d’inférence d’IA.

Nouveau processeur NVIDIA Vera avec cœurs Olympus : doublez les performances et trois fois plus de mémoire.

Le nouveau processeur NVIDIA Vera promet de doubler les performances de la génération actuelle, pour cela, il a 88 cœurs personnalisé NVIDIA Olympus avec deux threads par noyau pour réaliser 176 fils de discussion au total. Prend en charge jusqu’à 1,5 To de mémoire LPDDR5X, trois fois plus que la génération Grace actuelle, avec une bande passante de 1,2 To/s. Il offre également la prise en charge de l’interconnexion NVLink-C2C à 1,8 To/s pour la connexion avec le reste des puces du système.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 2

Le GPU NVIDIA Rubin promet des performances d’inférence IA 5 fois supérieures à celles de Blackwell

La partie la plus pertinente pour de nombreux processus impliqués dans le traitement de l’IA est le GPU. Le nouveau GPU NVIDA Rubin promet de multiplier par 5 les performances des GPU Blackwell actuels, atteignant 50 PFLOPS en inférence avec NVFP4.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 3

En formation avec le même type de données que nous avons 3,5 fois plus de performances que Blackwell, avec 32 TFLOPS. La bande passante de sa mémoire HBM4 intégrée double la bande passante précédente pour atteindre 22 To/S. De plus, il se connecte au processeur avec 3,6 To/s de bande passante NVLINK pour chaque GPU.

Chaque système Vera Rubin porte deux de ces GPU fonctionnent en même temps.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 4

NVIDIA ConnectX-9 Spectrum-x SuperNIC avec Ethernet 800 Gb/s

La NVIDIA ConnectX-9 Spectrum-x SuperNIC est la puce chargée de la connexion réseau de ces systèmes de calcul intensif, elle le fait avec une vitesse de 800 Gb/s via Ethernet, avec la dernière technologie en matière de sécurité de connexion et un total de 23 000 millions de transistors.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 5

LE DPU NVIDIA BlueField-4 multiplie sa capacité de calcul par 6

Le NVIDIA BlueField-4 DPU est une puce chargée des tâches informatiques de mise en réseau, de stockage et des tâches associées dont elle libère le CPU.

Cette nouvelle version dispose de 64 cœurs Grace et de 800 Gb/s, promettant deux fois plus de performances en matière de gestion de réseau, 6 fois plus de puissance de calcul et 3 fois plus de bande passante.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 6

Chaque Rack Vera Rubin s’intègre sans câbles ni ventilateurs dans un système de modules

L’un des avantages des racks NVIDIA Vera Rubin est qu’ils ont été conçus pour se connecter entre eux sans avoir besoin de câbles, formant ainsi un système intégré modulaire avec son propre refroidissement, plus facile à entretenir et à remplacer.

Grâce à cette conception et aux améliorations architecturales des différentes puces, l’ensemble du système est deux fois plus efficace que les générations précédentes

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 7

Ici, nous pouvons voir le module de calcul avec le CPU Vera et les deux GPU Rubin, avec son propre refroidissement intégré dans le module lui-même.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 8

Le commutateur NVIDIA NVLink 6 permet de connecter des GPU entre eux

Le commutateur NVIDIA NVLink 6 offre des capacités de communication de 3,6 To/s pour la communication entre les GPU, afin qu’ils puissent fonctionner comme un seul GPU pour les calculs haute puissance. C’est deux fois la bande passante du précédent commutateur NVLink 5.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 9

NVIDIA Spectrum-X, le système réseau Ethernet le plus avancé pour l’IA

Le Spectrum-X propose 128 ports de 800 Go/s et 512 ports de 200 Go/s pour interconnecter différents racks Vera Rubin dans un centre de données hautes performances. Il est capable de gérer 102,4 Tb/s pour communiquer avec tous les serveurs Vera Rubin qui composent le système.

Geeknetic Voici NVIDIA Vera Rubin : performances 5x en matière d'inférence IA et doublement de la puissance du processeur pour une nouvelle génération de supercalculateurs 10