NVIDIA创始人兼CEO黄仁勋于北京时间今日凌晨在GTC2012大会上发表主题演讲,光重大宣布就有三四项,但其中最受关注GPU发展动态的用户关注的还是TeslaK20的现身Kepler架构的真正旗舰GK110终于来了。 此次黄仁勋通过讲解Kepler架构新特性的方式引出了两款产品TeslaK10与TeslaK20,实际上三种特性中除SMX外均为GK110所独有,包括加强GPU利用率减少轻载使用情况的HyperQ以及加强任务并行度的DynamicParallelism。 HyperQ 由于Kepler架构的改进,GK110可以让最多32个CPU核心为单个GPU提供硬件工作队列,相比之下上代Fermi旗舰GF110只有1个。多条硬件工作队列可显著提升小负载的执行效率。 DynamicParallelism 此前的GPU如GF110在执行Kernel(程序内核)时,每执行一个或者一组Kernel都需要与CPU互动一次,Kernel需要由CPU创建。而在GK110中DynamicParallelism使得GPU能自己在执行完Kernel后自行判定并创建下面的Kernel,减少了与CPU互动的频率可节省时间,并提升GPU的计算效率。 GK110规格 NVIDIATeslaK10(双GK104) 实际上宣布的两款产品中,TeslaK10正是此前BSN爆料声称的GeForceGTX690的Tesla版,并且目前已经上市。NVIDIA宣称其具有3倍于上代Tesla旗舰M2090的单精度浮点计算能力4。577TFLOPS,内存带宽为320GBs,单个GPU160GBs略小于GTX690,内存为8GBGDDR5。 GK110核心照片 新产品基于GK110核心的TeslaK20目前NVIDIA官方只宣称双精度浮点约3倍于TeslaM2090,晶体管数量为71亿个,将于2012年第四季度进入市场。从核心图上来看,GK110拥有15个SMX,也就是CUDACore数量为192152880个。但根据PCinlife管理员cho爆料,其中一组被屏蔽作为冗余之用,上市产品CUDACore数量为2688个,双精度浮点计算能力为1。41。5TFLOPS左右。 NVIDIATeslaK20(GK110)