Les nouvelles innovations technologiques :
Qui dit nouvelle génération dit automatiquement de nombreuses innovations technologiques qui débarquent et cette RTX 4080, comme sa grande sœur la RTX 4090, ne font pas exception à la règle. Nous allons essayer de vous citer les plus importants dans cette page un peu plus théorique.
Nouvelle architecture Ada Lovelace :
C’est le 21 septembre à 17 heures, que NVIDIA a dévoilé une partie de sa future gamme de cartes graphiques architecturées autour de « ADA Lovelace ». Techniquement, cette puce est hors norme avec ses 76 milliards de transistors, sa gravure en N4 par TSMC, les Shader Execution Reordering, ses 90 TFLOPS, ses 200 RT TFLOPS, ses 1400 Tensor TFLOPS et un maximum de 18432 CUDA Cores dans un même GPU. Autant dire que c’est assez impressionnant face à la génération précédente Ampere.
La puce est organisée en 12 Graphics Processing Clusters (GPC) contenant chacun 72 Textures Processing Clusters (TPC) avec 144 Streaming Multiprocessors (SM). Les Streaming Multiprocessors bénéficient d’une nouvelle technologie appelée Shader Execution Reordering (SER) qui permettent de multiplier par deux les opérations du Ray Tracing. On peut aussi remarquer que la puce de la RTX 4090 est amputée permettant peut-être de voir une future RTX 4090 Ti débarquer.
Ces nouvelles RTX débarquent aussi avec des Tensor Cores de 4ème génération, qui seront bien utiles pour l’IA du DLSS et du DLSS 3 ainsi que des cœurs RT Cores de 3ème génération qui eux permettront de multiplier par deux les performances du Ray Tracing. En plus de l’évolution de génération, leur nombre augmente aussi par rapport à la génération précédente en fonction du modèle.
D’ailleurs, voici un tableau comparatif afin de juger des différences entre ces cartes.
GeForce RTX 3090 Ti | GeForce RTX 4090 | GeForce RTX 4080 | GeForce RTX 4070 Ti | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
GPU | GA102-350 | AD102-300 | AD103 | AD104 | |||||||
Taille GPU | 28.3 Billion | 76.3 Billion | |||||||||
Fabrication Process | Samsung 8 nm 8N | TSMC 4 nm | TSMC 4 nm | TSMC 4 nm | |||||||
CUDA Cores | 10752 | 16384 | 9728 | 7680 | |||||||
Tensors Cores | 336 (3ème Gen) | 512 (4ème Gen) | 304 (4ème Gen) | 240 (4ème Gen) | |||||||
RT Cores | 84 (2ème Gen) | 128 (3ème Gen) | 76 (3ème Gen) | 60 53ème Gen) | |||||||
Textures Units | 336 | 512 | 304 | 240 | |||||||
ROPs | 112 | 176 | 112 | 80 | |||||||
Boost Clock | 1860 MHz | 2520 MHz | 2505 MHz | 2610 MHz | |||||||
Memory Clock | 1313 MHz | 1313 MHz | 1400 MHz | 1313 MHz | |||||||
Memory Data Rate | 21 Gbps | 21 Gbps | 22.4 Gbps | 21 Gbps | |||||||
Memory Size | 24 GB | 24 GB | 16 GB | 12 GB | |||||||
L2 Cache Size | 6144 KB | 96 MB | 64 MB | 48 MB | |||||||
Memory Bus Width | 384-bit | 384-bit | 256-bit | 192-bit | |||||||
Memory Bandwith | 1008 GB/s | 1008 GB/s | 716.8 GB/s | 504.2 GB/s | |||||||
Total Graphic Power | 450 watts | 450 watts | 320 watts | 285 watts | |||||||
Le DLSS 3 débarque et est déjà opérationnel :
L’une des annonces de NVIDIA lors de sa conférence est l’arrivée du DLSS 3. Attention cependant, celui-ci n’est compatible qu’avec les RTX 4090 et RTX 4080. Les possesseurs d’une carte de génération précédente se conteront du DLSS 2 que NVIDIA continuera à faire évoluer dans les mois à venir.
Pour rappel, jusqu’à présent, le principe du DLSS (Deep learning super sampling) était de permettre un gain en terme de FPS en remplaçant l’antialiasing TAA. L’idée est de calculer le rendu dans une définition moindre que cela choisie dans les paramètres et ensuite de la repasser dans la définition dite en utilisant une IA appliquée via les Tensor Core tout en conservant une qualité d’image la plus parfaite possible.
Aujourd’hui, avec l’arrivée du DLSS 3, les choses changent même si le principe fondamentale d’augmenter le nombre de FPS est toujours la raison principale. La nouveauté vient du principe que le DLSS 3 permet d’ajouter des images intermédiaires entières et non plus des pixels. Cela permet ainsi d’augmenter le nombre d’images par seconde et par conséquence la fluidité. Pour y parvenir, le DLSS3 fait appel notamment à un accélérateur de flux optique intégré à la nouvelle architecture des RTX 4000. C’est la raison pour laquelle les générations précédentes qui n’en sont pas dotées ne pourront pas bénéficier du DLSS 3. Nous devrons donc être attentif lors de nos tests et comparer ce qui est comparable car oui, bien entendu le DLSS 3 sera plus performant mais difficile de le juger sur la génération Ampere qui ne le supporte pas.
Même si la fonction principale est d’augmenter le nombre de FPS, NVIDIA rappelle aussi l’importance de la latence. Nous avions d’ailleurs traité ce sujet dans cet article en vous parlant de Reflex. Pour résumer simplement, le principe est de faire diminuer au maximum la latence dans les jeux, c’est-à-dire le temps qui s’écoule entre le moment où vous cliquez sur le bouton de votre souris et sa manifestation à l’écran. Afin de pouvoir effectuer tous les relevés, une souris compatible sera nécessaire.
Les dernières avancées de NVIDIA risque de chambouler le monde du l‘e-sport puisque l’on pourrait voir débarquer des écrans 1440p 27″ en lieu et place des écrans actuellement utilisés en 1080p 25″. Pour terminer, sachez que NVIDIA annonce déjà plus de 35 jeux compatibles et prêts à utiliser le DLSS 3. Nous ajouterons bien entendu à nos tests des jeux prenant en charge le DLSS 3. Bien entendu les jeux DLSS 3 sont rétro compatibles avec la technologie DLSS 2.
La compression matériel AV1 :
NVIDIA intègre à présent sa 8ème génération d’encodeur NVENC avec AV1 qui se montre plus efficace de 40% face à H.264. L’arrivée de AV1 sera très utile notamment pour le streaming.