Les détails techniques des futures Geforce commencent à filtrer sur différents sites, et bien qu'il n'y ait pas encore eu d'annonce officielle, les informations semblent sérieuses.


Tout d'abord, les GT300 seront encore plus orientées GPGPU (General-Purpose Processing on Graphics Processing Units : la carte graphique est utilisée pour des calculs basiques servant dans divers milieux comme la recherche ou les finances) que ses ainées, décision prise par Nvidia pour tenter de s'emparer de ce nouveau marché et de prendre le dessus sur ATI ou Intel et son futur Larabee.
Cela se traduit dans un premier temps par l'abandon du SMID (Single Instruction Multiple Data) pour le MIMD (Multiple Instruction Multiple Data), ainsi l'ensemble des unités de la puce peuvent exécuter en simultané plusieurs types de calculs au sein de la puce. Dans la théorie, cela permet à la puce d'être beaucoup plus "polyvalente" et à chaque unité de celle-ci d'éviter des cycles à vide en l'orientant vers d'autres calculs. Dans la pratique, cette polyvalence sera un gain notable de performances à condition que la partie logicielle soit correctement développée.

On apprend aussi que le nombre de "Streaming Processors" (SM pour les intimes) sera de 512, contre 240 au sein de la GT200. On peut donc déduire l'architecture de la nouvelle puce en analysant la version précédente.
En schématisant la GT200, les "Streaming Processors" (SP) font partie des "Streaming Multiprocessors" (SM) faisant eux mêmes partie des "Thread Processing Clusters" (TPC ou clusters), en sachant que 8 SP forment un SM, et que 3 SM composent un Cluster et qu'il y a 10 Clusters sur la puce, cela nous donne : 10 clusters*3 Streaming Multiprocessors*8 Streaming Processors = 240 Streaming Processors.
Pour la GT300, on obtient alors : 16 Clusters*4 SM*8 SP = 512 Streaming Processors.

Ci-dessus, le diagramme de la GT200, en rouge le Cluster, en bleu le SM et en jaune le SP.

La puissance de calcul globale quant à elle serait de l'ordre de 3 Teraflops. A titre de comparaison, une GT200 titillait le Teraflop (0.933) alors que le RV 770 d'ATI arrivait à 1.2 Tflops. Attention, tous ces chiffres sont toutefois à prendre avec des pincettes car ils ne sont encore qu'officieux. Cette puissance brute de 3 Teraflops laisse quand même rêveur, bien que les solutions graphiques ultra puissantes ne soient pas forcément synonyme de performances records (syndrome HD 2900).

A toutes ces caractéristiques matérielles s'ajoutent les supports des technologies, à savoir CUDA (version 3.0), DirectX 11, OpenGL 3.1 ainsi qu'OpenCL. Nvidia ratisse large en incluant OpenCL, le langage de programmation open source GPGPU déjà accepté par ATI, qui pourrait parasiter CUDA, langage GPGPU propriétaire.