Rétrospective des cartes Nvidia (8800 GTX à aujourd’hui)

5

Geforce GTX 680 (GK104) :

Nvidia Geforce GTX 680
GeForce GTX 680

L’architecture « FERMI » était certes efficace en définitive, mais avait le grand défaut d’être consommatrice. Avec la venue de la gravure en 28 nm, Nvidia en profiter pour inaugurer l’architecture « KEPLER » avec la GeForce GTX 680, équipée du GK104.

D’ailleurs pourquoi Nvidia utilise un GPU nommé GK104 et non GK100 ou GK110 ? Par ce que ce n’est pas le plus gros GPU Kepler. Le plus gros GPU Kepler est le GK110, que Nvidia inaugurera dans sa GTX Titan, comme on le verra plus tard. Il est fort probable que le GK110 soit trop difficile à fabriquer à ce moment la.

Du coup, le nombre de transistors a peu augmenté par rapport à la GTX 580: 3.54 milliards, et la puce a une taille de 294 mm², ce qui est exceptionnellement petit pour un produit Nvidia. Normal, vu la gamme du GPU, aidé par la gravure en 28 nm.

Nvidia GK104.jpg
Schémas GPU Kepler GK104

Que peut-on dire sur Kepler ?

Publicité

Kepler n’est rien d’autre que l’architecture Fermi extrêmement boosté, et surtout optimisé pour allier performance vidéo ludique et consommation.

Quand on y observe l’organisation de la puce GK104 qui anime les GeForce GTX 680/670/660 Ti, elle est parfaitement identique à celle des Fermi, mais en plus grand, chose permise par la gravure plus fine.

En effet, elle dispose de 1536 processeurs de flux, un nombre gigantesque, le triple face aux GF110. Tout comme les Fermi, les processeurs de flux sont disposés par bloc SMX qui succèdent aux blocs SM des Fermi où la nouveauté principale est une consommation optimisée. La GK104 abrite 4 GPC (Graphic Processor Cluster) qui enferment chacun 2 blocs SMX qui abritent 192 cores CUDA chacun. On a donc en tout 8 blocs SMX pour 1536 unités.

Ces unités sont conçues pour une excellente performance dans la 3D avec une consommation moindre, mais cela en détriment d’un détail : le Computing. En effet, pour permettre aux GK104 d’être économe, Nvidia a du sacrifié pas mal de capacité en GPGPU, surtout en ce qui concerne la double précision qui est extrêmement faible. Le ratio est en effet de 1/24 de la simple précision, et cela est de mise également aux dérivées professionnels (Quadro et Tesla). On est loin des 1/8 de la GTX 580. On a donc 1216 FMA32 – 64 FMA64 et 256 SFU. On remarque donc que la puissance est essentiellement concentrée sur la simple précision qui atteint les 3000 GFLOP, mais seulement 128 GFLOP en 64 bits.

En matière de bibliothèque computing, la GK104 gère toujours OpenCL 1.1 (Bien qu’à ce sujet, la GK104 arrive mieux à calculer avec cet API), et CUDA en 3.0 qui dispose de registres plus grands. Mais la GK104 se révèle moyenne en globalité dans le computing, les divers tests dans ce domaine ont montré que la GTX 680 donnaient des performances de calculs avancées plus faibles comparés aux Fermi GF110.

Autre détail important : la fréquence d’horloge. Nvidia a décidé de mettre un terme aux 2 horloges qui animaient jusque-là les puces GeForce. Les processeurs de flux et les unités fonctionnent donc sous une même fréquence. Ceci fait partie des solutions afin de rendre la puce plus économique en consommation.

De plus, Nvidia intègre le Turbo Boost. A l’image des processeurs Intel, Nvidia intègre la possibilité aux puces Kepler d’augmenter la fréquence d’horloge suivant la situation. Elle est cependant limitée par une restriction : la consommation. Si elle dépasse de trop, le Turbo Boost ne sera pas employé. La GTX 680 dispose par exemple d’une fréquence de base de 980 Mhz qui peut grimper jusqu’à 1050 Mhz.

Tout comme les Fermi, chaque GPC abrite un Raster Engine, ce qui nous en fait 4 en tout. Pour ce qui est des Polymorph Engine, on dispose de 8 moteurs géométriques, car étant liés aux blocs SMX. Un nombre plus petit que les Fermi, mais leurs débit a été augmenté afin de pallier cette diminution.

Chaque bloc SMX dispose de son groupe de TMU. Chaque groupe abrite 16 TMU pour un total de 128 TMU, ce qui est une nette augmentation par rapport aux 64 TMU de la GTX 580. La raison est que la GTX 680 possède certes moins de SMX que la GTX 580 possédait de SM (GTX 680 : 8 SMX, GTX 580 : 16 SM), mais chaque SMX possède 16 TMU, contre 4 pour un SM. En résulte un plus grand nombre de TMU, donc une puissance de calcul de triangle améliorée, très utile dans les jeux vidéos.

En résumé l’architecture sous forme de SMX propose des blocs de plus grande taille (ils possèdent chacun plus de Cuda Core 192 contre 32, mais également plus de TMU comme on disait), par contre ils sont présents sur la GTX 680 en plus petit nombre. Car comme on disait, la GTX 680 est est loin de pousser au bout l’architecture Kepler.

Les unités ROP baissent à 32 unités avec le bus mémoire qui est de 256 bits. Tout ceci réparti en 4 groupes de 8 ROP. Mais malgré le bus plus petit, la mémoire augmente à 2 Go (contre 1.5 Go la GTX 580), ceci pour rester en adéquation avec les besoins du moment, toujours plus demandeur en quantité de mémoire graphique. Et aussi bien sûr pour rester dans la compétition avec la très bonne HD 7970 d’AMD, équipée de 3 Go en 384 bits. Toujours sur la mémoire, le débit reste identique malgré le petit bus employé. En effet, la fréquence mémoire compense strictement la perte au niveau du bus par rapport à la GTX 580. En effet, la GTX 580 possède un bus moitié plus important que la GTX 680, mais celle-ci possède une mémoire moitié plus rapide !

Des innovations ont été intégrées dans l’architecture Kepler, en particulier la gestion de l’affichage. On peut citer la possibilité de gérer 4 écrans HD (Jusqu’ici 2 depuis les Tesla), ou encore l’Adaptive V-Sync, une nouvelle technologie qui permet une meilleure gestion de la synchronisation verticale sur les écrans. Kepler intègre également de nouvelles technologies liés à l’anti-aliasing.

Pour la consommation, on disait que c’était un point important que Nvidia voulait résoudre, et c’est chose faite : Seulement 195 Watts de TDP pour des performances 3D largement supérieures à une GTX 580. On peut dire que la GK104 est une réussite totale sur ce point, surtout face à la concurrente d’AMD, la HD 7970, avec son TDP de 250 Watts. Malgré tout, l’écart réel en consommation entre ces deux cartes est plus ténu que cela, bien que toujours à l’avantage de la Nvidia. Mais la GK104 montre certaines limites aux très hautes résolutions (supérieures à 1080p) par rapport à la concurrence à cause de son bus mémoire de 256 bits, alors que c’est où AMD montre ses griffes avec le 384 bits qui anime les HD 7900. En effet les HD 7970 culmines à 264 Go/s (voir 288 Go/s pour la GHz Edition)  là où la GTX s’arrête à 192 Go/s.

Nvidia Geforce GTX 660
GeForce GTX 670/660 Ti

Les dérivés seront les GTX 670 qui auront 1 SMX de moins, et la GTX 660 Ti avec son bus rabaissé à 192 bits. Les autres seront les GK106 et GK107. La GTX 660 en GK106 aura par exemple 5 SMX et un bus de 192 bits.

Nvidia clôtura la série G600 avec la GTX 690, une carte double-puce au design magnifique et aux performances très intéressantes pour un TDP relativement faible pour une bi-puce : 300 Watts. Mais avec un défaut assez ennuyeux : le prix, de 1000 € environ.

Nvidia Geforce GTX 690
GeForce GTX 690

Voici la gamme complète des GeForce 600 :

Geforce 600 haut de gamme
Cliquez pour agrandir
Geforce 600 entrée de gamme
Cliquez pour agrandir
S’abonner
Notifier de
guest

5 Commentaires
Newest
Oldest Most Voted
Inline Feedbacks
Voir tous les commentaires
tamixx
tamixx
11 avril 2015 15h21

sur la page 9
« La GTX 960 en étant équipée n’arrive malheureusement que très très loin derrière la GTX 960 »
euuuh GTX 760 plutot non?

geekosa
13 mai 2015 15h20
Répondre à  tamixx

Non c'était GTX 970. My bad
« La GTX 960 en étant équipée n’arrive malheureusement que très très loin derrière la GTX 970″

haendal
haendal
11 septembre 2014 12h38

Ce qui est marrant et bizarre c’est que les vieille carte marche toujours, ma tour de compète étant HS je me suis rabbatu sur mon 8930g avec un t5800 et une 9600m gs OC et j arrive a faire tournée tomb raider (le dernier) a 30fps en normal et en 1680*940 ainsi Tera a 25/30 FPs en config 4/5 en 720p ainsi que borderland 2 en élevée !

jaketyler01
jaketyler01
11 septembre 2014 10h14

La bonne vieille 8800 GTX alala je m’en souviens, la carte que tout le monde commandait pour tenter de faire tourner Crysis premier du nom au max ! 😀

geekosa
11 septembre 2014 12h24
Répondre à  jaketyler01

Et qui n’y arrivait pas malgré tout (je me rappel elle tournait à 15 FPS par là ^^)