Sites Internet

Nvidia dévoile l'architecture Fermi de prochaine génération

Les PC portables surpuissants pour créatifs envahissent le Computex

Les PC portables surpuissants pour créatifs envahissent le Computex
Anonim

Nvidia pourrait renommer sa NVISION promotionnelle conférence à la "GPU Technology Conference", mais c'est toujours un spectacle Nvidia à travers et à travers. Le PDG de Jen-Hsun Huang a pris le temps de dévoiler la prochaine grande architecture GPU de l'entreprise, baptisée "Fermi". C'est la puce graphique que les fans appellent GT300, le successeur générationnel de la puce GT200 qui alimente des cartes comme la GeForce GTX 285.

Le géant de la puce a pris soin de positionner la puce comme une nouvelle puce graphique, mais une nouvelle " calculent et les graphiques" en puce, dans cet ordre (en italique le mien). En fait, presque tout ce qui a été révélé à propos de la nouvelle puce se rapporte à ses caractéristiques de calcul, plutôt qu'à des éléments traditionnellement orientés graphiques comme les unités de texture et les extrémités de rendu. Ce que nous savons, c'est que la puce est énorme à environ 3,0 milliards de transistors, et sera produite sur un processus de 40nm à TSMC. Il s'agit d'environ 40% de transistors de plus que la puce RV870 des nouvelles cartes DirectX 11 de la série Radeon 5800 qui vient d'être lancée par son concurrent AMD. La puce comporte 512 unités de traitement (Nvidia les appelle cœurs CUDA) organisées en 16 "multiprocesseurs de streaming" de 32 cœurs chacun. C'est plus du double des 240 cœurs du GT200, et les cœurs ont d'autres améliorations significatives. La puce utilisera une interface mémoire GDDR5 de 384 bits

Voici certains des principaux points:

Multiprocesseur de troisième génération (SM)

  • 32 cœurs CUDA par SM, 4x par rapport à GT200
  • 8x les performances en virgule flottante double précision sur GT200
  • Dual Warp Scheduler qui planifie et distribue deux chaînes de 32 threads
  • par horloge
  • 64 Ko de RAM avec un partitionnement configurable de la mémoire partagée et du cache L1

Second Exécution de thread parallèle de génération ISA

  • Espace d'adressage unifié avec prise en charge C ++ complète
  • Optimisé pour OpenCL et DirectCompute
  • Complet IEEE 754-2008 32 bits et 64 bits de précision
  • Chemin d'accès complet 32 ​​bits avec 64 Extensions
  • Amélioration des performances via la prédication
  • Sous-système mémoire amélioré

Hiérarchie NVIDIA Parallel DataCache avec L1 configurable et L2 unifiée

  • Caches
  • Premier GPU avec support de mémoire ECC
  • Opération de mémoire atomique grandement améliorée performance
  • Moteur NVIDIA GigaThread

Commutation de contexte d'application 10 fois plus rapide

  • Exécution simultanée du noyau
  • Exécution du bloc de threads hors service
  • Moteurs de transfert mémoire double chevauchement
  • De nombreuses fonctionnalités supplémentaires la performance de cette puce dans les tâches de calcul de flux, comme beaucoup plus rapide taux de calcul en virgule flottante double précision. Les GPU Nvidia actuels calculent la double précision à une fraction de la vitesse des opérations à simple précision. Les opérations en virgule flottante en double précision devraient maintenant représenter la moitié de la performance en simple précision, ce qui représente une amélioration considérable. De grandes améliorations dans la mise en cache et la planification sont également évidentes. Vous pouvez en savoir plus sur l'architecture de la nouvelle page Fermi de Nvidia, qui comprend un livre blanc PDF

Alors, quand allez-vous acheter une carte graphique qui utilise cette puce? Nvidia ne dit pas. Les représentants de l'entreprise ont déclaré qu'ils étaient en train de «faire monter la puce», ce qui signifie que les échantillons de travail ne sont revenus que récemment de l'usine de fabrication. Si l'on se fie à l'histoire passée, on pourrait dire que décembre est une date de sortie optimiste et que le premier trimestre de 2010 est plus probable. Attendez-vous à des conseils coûteux. Nvidia ne divulguera pas la taille de la puce, mais si l'on en juge par le nombre de transistors, on devinerait entre 450 et 500 mm

2 . Couplé avec les coûts supplémentaires d'une interface mémoire de 384 bits et les défis à relever pour obtenir de bons rendements à partir d'un aussi gros morceau sur le processus de fabrication relativement nouveau 40nm, et vous regardez des cartes qui sont susceptibles d'être à la fois plus puissant et plus cher que les cartes de la série Radeon 5800 d'AMD qui viennent d'être publiées. Suivez Jason Cross sur Twitter ou visitez son blog.