Les prochaines RTX 40 2x plus rapides que les RTX 30 ?

0

C’est la rumeur du jour sur les prochaines cartes Nvidia. Ces nouvelles fuites proviennent de Kopte7kimi et parlent du schéma fonctionnel de l’architecture de la nouvelle génération des verts. Une image du schéma fonctionnel du GPU AD102 ‘Ada Lovelace’ va nous permettre de nous projeter sur les performances des prochaines RTX 40.

RTX 40

RTX 40 : une fiche technique impressionnante ( si elle est vraie )

Pour commencer, le GPU Ada Lovelace AD102 comportera jusqu’à 12 GPC (Graphics Processing Clusters). Il s’agit d’une augmentation de 70 % par rapport au GA102 ( le plus gros de la gamme actuelle ) qui ne comporte que 7 GPC. Chaque GPU sera composé de 6 TPC et de 2 SM, ce qui correspond à la même configuration que la puce existante. Chaque SM (Streaming Multiprocessor) abritera quatre sous-cœurs, ce qui est également la même chose que le GPU GA102. Le vrai changement, c’est la configuration du noyau FP32 et INT32. Chaque sous-cœur comprendra 128 unités FP32, mais les unités combinées FP32 + INT32 iront jusqu’à 192. En effet, les unités FP32 ne partagent pas le même sous-cœur que les unités IN32. Les 128 cœurs FP32 sont séparés des 64 cœurs INT32.

RTX 40 schema
                    Une des images du diagramme d’un GPU RTX 40 en provenance de Kopte7kimi

Le cache devrait être un autre domaine où NVIDIA a mis le paquet par rapport aux GPU Ampère existants. Les GPU Ada Lovelace contiendront 192 Ko de cache L1 par SM, soit une augmentation de 50% par rapport à Ampere. Cela représente un total de 4,5 Mo de cache L1 sur le GPU AD102 supérieur. Le cache L2 sera porté à 96 Mo, un chiffre régulièrement évoqué dans plusieurs fuites. C’est près de 16 fois plus par rapport au GPU Ampere qui n’héberge que 6 Mo de cache L2. Le cache sera partagé sur le GPU.

Publicité
Pour aller plus loin :
La RTX 4090 en phase de test ?

Si les fuites sont véridiques, nous avons une augmentation exponentielle du cache L2, qui passe à un total de 96 Mo pour l’ AD102 . Concernant les ROP ont aurait sur cette architecture deux fois plus d’unités, 32 par GPC pour être précis, ce qui nous donnerait un total de 384 ROP pour une éventuelle RTX 4090 contre 112 pour la RTX 3090…Sur le papier c’est monstrueux.

RTX 40 comparaison
                    Comparaison de caractéristiques de GPU. AD102 serait le sommet de la gamme RTX 40

Mais après cette orgie de données techniques, que pouvons nous attendre vraiment comme gains ?

Il est évidemment encore tôt pour avoir une idée précise mais si ces éléments se confirment, la fiche technique permet de constater une énorme différence par rapport à Ampere. Pour résumer :

  • X2 GPC (par rapport à Ampere)
  • 50 % de cœurs en plus (par rapport à Ampere)
  • 50 % de cache L1 en plus (par rapport à Ampere)
  • 16x plus de cache L2 (par rapport à Ampere)
  • X2 ROP (par rapport à Ampere)
  • Tenseur de 4e génération et cœurs RT de 3e génération

Mais que peut-on en attendre en termes de performances réelles ?

C’est bien difficile car une donnée clé nous manque : la fréquence de fonctionnement

Si on spécule un peu sur ce sujet, on arrive à se projeter sur une puissance en FP32 de 90 TFLOPS, plus du double de celle du GA102 actuel. Cependant avec les TFLOPS on peut aussi avoir des surprises. S’ils donnent une idée d’une performance brute, ils ne permettent jamais de préjuger des résultats en utilisation « de tous les jours ». Les fuites annonces de x2 à x2.2 par rapport aux RTX 30…Il y aura un gain évidemment, il semble s’annoncer conséquent. Mais pour se prononcer au delà de ça, il faudra attendre encore un peu.

 

S’abonner
Notifier de
guest

0 Commentaires
Inline Feedbacks
Voir tous les commentaires