Guide Technique des Cartes Graphiques (partie 2)

6

De quoi est constitué un Stream Processor ?

Le Stream Processor est l’unité de base d’une carte graphique. Une carte récente en possède plusieurs centaines. Les Stream Processors (SP) ou processeurs de flux sont les éléments prépondérants dans la puissance de calcul d’une carte et donc des performances générales de celle-ci.

Il faut savoir que ces processeur de flux ne sont pas uniformes en matière de fonctionnalités. Il existe en effet 2 types d’unités:

  • Les unités FMA/INT: Elles effectuent les calculs de nombres réels entiers (INT) et à virgule flottante (FLOAT). Elles sont uniformes sur ce point, mais pas sur la précision des calculs. Certaines ne peuvent que calculer en simple précision (32 bits ou FP32), on les appelle les FMA32. D’autres peuvent calculer en simple ou en double précision (64 bits ou FP64), ce sont les FMA64. Ces dernières sont donc plus polyvalentes mais plus consommatrices. Il est donc contre productif de mettre beaucoup de ces unités spécialisés dans une carte qui aura pour vocation de faire massivement des calculs 32 bits. Notez que ces unités sont toutes capables de manipuler des entiers.
  • Les unités SFU (Special Function Units): Peu utilisées, ces unités effectuent des calculs spéciaux comme le COS, SIN, LOG etc… Cependant, elles peuvent également calculer du FMA32. Leurs nombres varient suivant la gamme et l’architecture employée.

La capacité de calcul FMA64 par rapport à la puissance FMA32 est appelé le ratio FMA.

Publicité

Chez Nvidia, il varie beaucoup selon les générations :

  • La génération Tesla qui anime les GeForce 8, 9 et 200 ne prendra en charge le FP64 qu’a partir des GTX 280 et GTX 260. Le ratio est de 1/8 pour les GT200, c’est à dire que la puissance de calcul en double précision est égal à 1/8 de la puissance en simple précision. Il en est de même pour les dérivés professionnelles avec Quadro et Tesla, car il était difficile de faire mieux avec cette architecture.
  • La génération Fermi qui anime les GeForce 400 et 500 ont un ratio de 1/8 pour les GF100/GF110 grand public (GTX 480 et GTX 580) qui s’abaisse à seulement 1/2 pour les dérivés professionnelles (Quadro et Tesla), ce qui veut dire qu’elles sont plus rapides pour les calculs en 64 bits. La double précision est également présente sur les modèles de gamme moyenne comme les GF104/GF114 où le ratio est de 1/12 (GTX 460 et GTX 560).
  • La génération Kepler qui anime les GeForce 600 et 700 a un ratio plus drastique à l’égard des Fermi/Tesla. Il est en effet de 1/24 pour les GK104 (GTX 680, GTX 770), et cela même avec les dérivés pour les entreprises. Ces modèles concentrant sans doute leur effort sur la simple précision, ce qui a eu pour conséquence d’avoir des cartes graphique à moindre consommation. Pour les modèles haut de gamme, les GK110, la ratio est de 1/3 pour la GTX Titan et les modèles pros, mais est de nouveau pour à 1/24 pour les autres modèles comme les GTX 780 et GTX 780 Ti, afin que la GTX Titan garde un avantage sur le calcul professionnel.

Pour les modèles issus de ATI/AMD, les ratio sont plus réguliers:

  • A partir des Radeon HD3800 (RV670), la double précision a été intégré avec un ratio de 1/5. Ce ratio reste identique aux générations suivantes: HD4800 (RV770), HD5800 (RV870).
  • A partir des Radeon HD6900 (RV970), la ratio s’abaisse à 1/4. Il en sera de même pour les HD7900 et R9-280X. De plus, AMD a décidé de rendre la double précision disponible pour les gammes moyennes et entrée de gamme (HD7800, HD7700, R9-270(x), R7-260(x), R7-250/240) avec un ratio de 1/16. Notons également le fait que le GPU Hawaii qui anime les R9-290(X) ont un ratio de 1/8, certainement pour éviter que ces cartes déjà monstrueuses et difficiles à refroidir ne deviennent ingérables.

D’où provient le ratio FMA?

En se basant sur ce que vous avez lu sur la partie de types de processeurs de flux, il y a les unités FMA32 et FMA64. Le calcul 32 bits est effectué par toutes les unités, mais le 64 bits est spécifique aux FMA64. De ce fait, la puissance de calcul d’une carte en Float 64 bits est forcément moins élevée que celle en 32 bits. Cela revient au ratio dont on parlait précédemment.

Prenons un exemple avec la GeForce GTX 280 (GeForce 200). Elle dispose au total de 240 processeurs de flux, ces 240 unités font toutes du 32 bits. Parmi elles, se trouvent 30 unités particulières qui peuvent effectuer des calculs en 64 bits, seulement 30 sur 240 au total. Sachant que toutes unités fonctionnent sous un même cycle de bits (FLOP/Mhz) par cycle d’horloge, on fait donc une simple division: 30/240=1/8. On retrouve notre ratio de 1/8.

Les constructeurs peuvent réduire la puissance en 64 bits en diminuant physiquement le nombre d’unités FMA64, ce qui est souvent le cas pour les cartes graphiques non-haut de gamme (afin d’avoir des réductions de coût et de consommation). Mais il peut arriver que ce bridage se fasse d’une autre manière (ce qui est plus rare), cela s’est constaté avec la dernière GeForce GTX 780 Ti. Cette carte dispose de toutes les unités FMA64, mais cadencées qu’à 125 MHz environ si du 64 bits est demandé (au lieu de 1000 MHz environ pour les autres), ce qui fait qu’après un calcul, on retrouve notre ratio de 1/24 (même ratio que sur les autres GeForce 600/700, mais par une réduction du nombre d’unités).

Ainsi, vous saurez maintenant ce que signifient ces chiffres, que l’on avait déjà abordé sur notre guide technique des cartes graphiques précédant.

page suivante

S’abonner
Notifier de
guest

6 Commentaires
Newest
Oldest Most Voted
Inline Feedbacks
Voir tous les commentaires
Exosky
Exosky
16 août 2014 14h13

Super guide ! Merci beaucoup 🙂

J’aurais néanmoins une petite question :

Si j’ai bien compris, l’image est créée par la CG et transmise via un câble à l’écran qui transforme ce signal en pixels. (en gros)
La fréquence maximale des câbles présentés est de 120Hz. J’imagine que cela signifie que 120 images/s peuvent transiter via ce câble, corrigez-moi si je me trompe.

Dans ce cas, pourquoi existe-t-il des écrans 144Hz ? D’où sortent les 24 autres images ?

geekosa
16 août 2014 15h36
Répondre à  Exosky

Merci

Alors en fait, si tu branches ton écran avec un cable numérique, des données binaires sont transmises à l’écran, qui se charge de l’afficher (sous forme de pixels). Si tu le branche avec un câble analogique, dans ce cas ta carte graphique transforme le flux binaire numérique en signal analogique. L’écran reçoit alors ce signal analogique et le transforme en flux binaire numérique. Cette double transformation rée une (grosse) perte de qualité.

Ensuite concernant la fréquence, pour profiter du 144 Hz, il faudra impérativement brancher l’écran en Display Port ou en DVI, l’HDMI étant limité à 120 Hz

Exosky
Exosky
16 août 2014 19h00
Répondre à  geekosa

Le Display Port n’est pas limité à 120Hz ?

PastiYou
14 mars 2014 13h28

Comment réussir à faire comprendre à tout le monde des termes réservés aux utilisateurs confirmés ? Pas évident, et pourtant OMF l’a fait.
Merci.

Synclinal
Synclinal
14 mars 2014 9h43

Je serais intéressé par les avantages d’utiliser plusieurs cartes graphiques (SLI ou CrossFire) et leurs désavantages. Est-ce que la quantité de mémoire vidéo se cumule ? Est-ce que la calcul de la physique (ou l’IA) déportée est plus efficace ? Bref, plein de questions… 😉

Iraldin
Iraldin
14 mars 2014 13h21
Répondre à  Synclinal

Petit début de réponse, la mémoire ne se cumule malheureusement pas ^^