Il est ici question d’une rumeur, bien entendu, tout ceci est à prendre avec des pincettes. Cependant, elle nous provient de @kopite7kimi sur X.com, un leaker qui su prouver sa valeur… Suffisamment pour qu’on l’écoute. Et d’après lui, la puce de jeu GB202 exploiterait le même process de fabrication que le B100 de serveur.
GB202 : une puce gravée suivant le process TSMC 4NP ?
Si l’on en croit ce qui est dit, la potentielle future RTX 5090 pourrait être gravée avec le même process que celui de la B100. Cependant, le leaker indique qu’il s’agirait du 4NP qu’il ne retrouve pas dans la nomenclature de TSMC. Dès lors, des suppositions indiquent qu’il pourrait s’agir d’une version personnalisée pour NVIDIA et déclinée du process TSMC 5. Toutefois, cela serait clairement bénéfique pour la carte puisqu’il permet une augmentation de 30% de la densité des transistors.
GB202 will use the same process node as GB100. I must clarify once again that TSMC 4N(vidia) is based on TSMC 5, not 4nm.
I'm sorry I cannot match Jensen's naming with TSMC's naming. We need professional chip analysis to determine.
At least, there is a 30% increase in density.— kopite7kimi (@kopite7kimi) March 19, 2024
Autre piste d’amélioration pour le GPU, la mémoire cache L1 qui pourrait être revisitée. Sur les GPU Ada Lovelace et Ampere, nous retrouvions alors 128 Ko de cache. Cette quantité pourrait être revue à la hausse, améliorant le débit des SM.
Just look at the L1 Cache of one SM, GB202 definitely has a significant improvement compared to AD102 and GA102(128 KB). It means the throughout of a single SM will increase.
— kopite7kimi (@kopite7kimi) March 19, 2024
Enfin, pour ce qui est de ce GB202, des rumeurs précédentes évoquaient un GPU disposant de 192 SM, soit un potentiel de 24 576 cuda core si leur nombre par SM ne change pas. Quant à la partie mémoire, il serait question d’un bus de 512 bits avec de la mémoire en GDDR7 fonctionnant à 28 Gbps.
Dernier point, la puce pourrait également profiter d’une conception MCM avec deux chiplets, un peu comme la B200 dont nous vous parlions plus tôt dans la matinée. Ceci serait alors bien pratique pour produire des RTX 5080 possiblement basées sur un GB203 qui serait un demi GB202 (96 SM + mémoire en 256 bits).