On connait le nombre de coeur de la prochaine Titan

6
3349

Après une conférence GTC axé sur la VR et ses technologies, Nvidia a révélé une chose intéressante : les caractéristiques de GP100, le plus gros GPU de l’architecture Pascal. Attention, ce qui va suivre n’est donc pas une rumeur, mais quelque chose à prendre avec une grande certitude.

Déjà sur l’architecture Pascal, les SM ne posséderont plus 128 Cuda Core et 8 TMU (comme Maxwell) mais 64 CUDA Core et 4 TMU. En gros, ils seront deux fois plus petits. La grosse nouveauté de ce bloc est le nombre de CUDA Core FP64 : il y en a 32 (soit la moitié du nombre de FP32). Sur Maxwell, il y en avait 4 (soit 1/32 du nombre de FP32). Nous aurons normalement que 4 unités de dispatch, contre 8 sur Maxwell. La cache sera de 256 Ko par SM soit autant que Maxwell. Bref l’unité SM est clairement simplifié, ce qui permettra d’en mettre un plus grand nombre. Regardez pour comparaison :

SM Pascal

Nvidia SMM

Mais seront aussi beaucoup plus nombreux ! Le GP100 accueillerait ainsi au maximum 60 SM répartis en 6 GPC (La Titan X ayant 24 SM répartis en 6 GPC). Le design général ressemble d’ailleurs beaucoup :

GM200

GP100

Le GPU pourra donc monter jusqu’à 3840 CUDA Core FP32 (et 1920 Cuda Core FP64). Ce qui en fera, et de loin, la carte avec le plus gros potentiel 64 bits jamais sortie jusqu’alors. La montée en nombre de cores peut sembler limitée, mais il semblerai que la diminution de la taille du SM vise à augmenter l’efficacité du GPU.

Le GPU sera équipé de 16 Go de HBM 2, qui aura une bande passante de 720 Go/s. C’est moins que les 1024 Go/s prévus par la norme HBM 2, mais la fréquence a été réduite pour des raisons énergétiques. D’ailleurs parlons-en de l’énergétique. Vous qui pensiez que le 16 nm permettrait d’avoir des cartes qui consomme trois fois rien, détrompez-vous !

La Tesla P100, équipé d’un GPU bridé à 56 SM (au lieu de 60) et donc 3584 Cuda Core, tournant à une fréquence de 1328/1480 MHz aura un TDP de 300 W ! Oui messieurs dames !

P100 GPU

Pour la prochaine Titan à venir, si elle est équipé de l’intégralité de ses 60 SM, et que son GPU tourne à 1500 MHz turbo, cela lui conférera une puissance de 11.5 TFLOPS FP32, soit 75 % de mieux que la Titan X quand même !

Par contre, ce GPU ne sera pas disponible cet été, on commencera avec le GP104. En clair, le Schéma de Maxwell va recommencer.

Contenu en rapport

0 0 vote
Article Rating
S’abonner
Notifier de
guest
6 Commentaires
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
Trinitas
6 avril 2016 15 h 25 min

T’as oublié un détail important dans le débit GPGPU, c’est le FP16. Alors que jusqu’ici, le débit était calculé avec « nbr de cores x fréquence x 2 », le FP16 change de régime, et passe à x 4, donc la GP100 pointe à 22 TFLOPs en FP16^^

Ctrlfix
Éditeur
6 avril 2016 15 h 50 min
Reply to  Trinitas

lourd !

Gungar
Gungar
6 avril 2016 10 h 16 min

Est-ce qu’on est sûr qu’on ne verra pas la Titan bientôt?

Par contre, c’est confirmé que la 1080 tournera à plus de 1500 mhz, vu que la Tesla tourne déjà à presque 1500mhz en turbo mode.

Gungar
Gungar
6 avril 2016 10 h 17 min
Reply to  Gungar

La Titan pas la 1080, petite erreur.