Inside : Pascal GP104 (GTX 1080)

1

Cet inside est consacré sur le GPU Pascal GP104. Pour  bien comprendre, il est important d’avoir au-préalable lu le Quicky expliquant l’organisation d’un GPU.

Présentation GP104 :

Le GPU GP104 anime 3 modèles de carte graphique publique à l’heure actuelle : la GTX 1080, la GTX 1070 Ti et la GTX 1070. Il représente le haut de gamme pour le grand public. Pour le domaine professionnel, on a la Quadro P5000, Quadro P4000 et la Tesla P4.

GTX 1080
GeForce GTX 1080

Gravée en 16nmFF TSMC, elle abrite 7.2 milliards de transistors sous un die de 314 mm². Son TDP est prévu à 180 Watts.

GPU GP104
GPU GP104

Basée sur l’architecture Pascal, la GP104 dispose de 4 GPC Pascal entiers. Chaque GPC Pascal possède 5 SM, donc un total de 20 SM. Chaque SM possède 128 CUDA Cores, cela n’a pas changé depuis Maxwell.

Publicité

Nous avons donc un total de 20 x 128 = 2560 CUDA Cores et  20 x 8 = 160 TMU. Nous avons donc 25 % d’unités CUDA et TMU en plus que le GM204, le prédécesseur du GP104.

GP104 GPU diagramme
GP104 GPU diagramme

Parlons maintenant des autres unités. Au niveau des Raster Engine, il y en a toujours 1 par GPC, donc un total de 4. Les Polymorph Engine, les unités de calcul géométriques, sont présentes en 1 exemplaire sur chaque SM, donc on a affaire à 20 Polymorph Engine.

Autour des unités :

Les ROPs sont organisés en blocs. Chaque GPC contient 2 blocs de 8 ROPs. Nous avons donc un total de 4x2x8 = 64 ROPs. Le nombre de ROPs n’augmente pas par rapport au GM204 Maxwell. En revanche, les ROPs disposent de technologies de compression plus avancées, permettant ainsi des débits effectifs plus élevés.

Pour aller plus loin :
Nvidia pourrait lever le pied sur les GPU Gaming au profit de l'IA

Tout comme l’ancienne GM204, la mémoire cache L2 reste inchangée à 2048 Ko. Le tout divisé en 8 blocs de 256 Ko pour chaque contrôleur VRAM.

Au sujet de ces contrôleurs VRAM, la GP104 abrite 8 de 32 bits, reliés chacun à 1 puce VRAM G-DDR5(X) en 32-bits. On a donc une interface mémoire de 256-bits, relié à 8 puces VRAM au total. Là aussi, aucune évolution en terme de largeur de bus ou de nombre de contrôleur face à Maxwell. Ce qui change, c’est le débit de ces derniers, avec une GDDR5 plus rapide, voir dans certains cas de la GDDR5X !

Récapitulatif:

On finit ce dossier avec ce tableau qui récapitule les modèles employant la GP104:

Tableau GP104

S’abonner
Notifier de
guest

1 Commentaire
Newest
Oldest Most Voted
Inline Feedbacks
Voir tous les commentaires
fildefer
fildefer
18 avril 2018 14h40

J’aime bien ces articles, ça parle de choses intéressantes.