Blackwell, le GPU le plus puissant du monde !

1

NVIDIA profite de la GTC pour dévoiler ses GPU Blackwell et vante des caractéristiques tout simplement hors normes. Effectivement, le B200 arrive avec un total de 208 milliards de transistors répartis sur deux dies. Il est également question du premier GPU MCM de chez NVIDIA tandis que les performances font x5 par rapport au H100 !

Blackwell B200 : des perfs qui font x5 face au H100 ! 

NVIDIA Blackwell B200
Source : Tom’s Hardware.com.

Pour le coup, nous apprenons que le GPU de NVIDIA profite d’une conception MCM, le tout étant produit par TSMC. Quant à la gravure, nous retrouvons une finesse de 4 nm via le process N4P. Tout ceci permet d’intégrer un total de 208 milliards de transistors, 104 milliards par die.

Ces deux chiplets sont également interconnectés les uns aux autres via un lien affichant une bande passante de 10 To/s. TechpowerUp indique que c’est suffisamment rapide pour que chaque chiplet puisse adresser et accéder à la mémoire de l’autre sans problème. Enfin, pour la communication entre chaque GPU, nous avons un lien NVLINK offrant une bande passante de 1,8 To/s.

La partie mémoire fait également peur bien que finalement connue. Chaque chiplet profite alors de 96 Go de mémoire HBM3e avec un bus de 4096 bits. Cela nous fait donc un total de 192 Go de VRAM avec une bande passante de 8 To/s.

Publicité

En plus de tout ceci, nous retrouvons des Tensor Core de sixième génération supportant le FP4 et le FP6.

GB200 : deux B200 + un CPU ARM Grace ! 

Dans un second temps, NVIDIA annonçait quelque chose d’encore plus fou avec le GB200. Il est ici question d’un module intégrant deux GPU B200 couplés à un processeur ARM Grace doté de 72 cœurs Neoverse V2 d’après El Chapuzas Informatico.

NVIDIA Blackwell GB200
Source : Tom’s Hardware.com.

Les performances sont donc monstrueuses :

  • FP4 : 20 PFLOP (Dense) – 40 PFLOP (Sparse)
  • FP6 – FP8 : 10 PFLOP (Dense) – 20 PFLOP (Sparse)
  • INT8 : 10 PFLOP (Dense) – 20 PFLOP (Sparse)
  • FP64 Tenso Dense : 90 TFLOP

Les caractéristiques sont également doublées avec des modules présentant 384 Go de mémoire, une bande passante de 16 To/s et une bande passante NVLINK de 2x 1,8 To/s.

Mais la consommation est également doublée avec ses 2700W au total à dissiper. Sachez qu’à lui seul, un B200 affiche un TDP de 1000W contre 700W pour le B100… Tout ça pour de l’IA.

Quant à la disponibilité, normalement, les premières expéditions devraient débuter d’ici la fin de l’année. Les prix ne sont pas communiqués, mais ça va piquer !

S’abonner
Notifier de
guest

1 Commentaire
Newest
Oldest Most Voted
Inline Feedbacks
Voir tous les commentaires
News
News
19 mars 2024 13h40

OMG : 2.7kw/h ils refroidissent comment un tel monstre ?