两年前NVIDIA的Tegra3是世界首款四核CortexA9处理器,今年的CES前夕NVIDIA又顺利地抢先发布了世界第一款四核CortexA15处理器,而且借着Tegra4的强大性能,NVIDIA还推出了代号ProjectShield的游戏机,左手持Tegra4利刃,右手握游戏机盾牌,杀向了今年的移动处理器市场。 发布几天来,我们也陆续了解了一下Tgera4处理器的一些规格以及跑分性能,不过它背后还有很多不为人知的秘密。超能网综合了多方来源对Tegra4处理器的介绍与分析,还有各种吐槽,大家也可以从多个角度来了解一下NVIDIA2013年的第一款明星产品。 文中提到的内容及数据主要来源于几家国外权威媒体,包括Anandtech、Extremetech、Heise以及“毒舌”BSN,下文不再一一提及。 Tegra4基本情况:四核CortexA15架构、频率最高1。9GHz NVIDIA的Tegra4是世界首款四核CortexA15架构ARM处理器,此前唯一的CortexA15处理器是三星的Exynos5Dual双核,Nexus10上使用的正是1。7GHz频率的Exynos5250,因此在四核架构方面Tegra4还是比较领先的,不过三星今年将推出big。LITTLE架构的八核处理器,内有4个CoretexA15和CortexA7核心,华为据说也在开发CortexA15架构的K3V3处理器,Tegra4还要加速上市速度才行。 Tegra4处理器核心架构图 Tegra4使用的是TSMC的28nmHPLHKMG工艺,相比HPM工艺它主要优化了漏电流和峰值频率,比Tegra3使用的40nmLPG工艺优秀得多,所以Tgera4的最高频率达到了1。9GHz,核心面积约为80mm2,低于苹果A6X的124mm2,基本维持在了Tegra3的80mm2量级,只不过晶体管规模肯定更高,具体数值未知。 此外,Tgera4依然沿用了Tegra3的4Plus1设计,也就是说实际上有5个核心,另外一个隐藏核心也是CortexA15架构的,不过频率、电压以及功耗要低得多,主要用来应付一些不需要高性能的应用,这样可以降低功耗,延长续航时间。 这个隐藏伴生核心在系统里也是不可见的,而且它也不是三星那样的big。LITTLE架构,工作原理应该跟Tegra3里的隐藏核心类似。 内存方面,Tegra4终于一改Tegra3只支持单通道内存的不足了,开始支持双通道LPDDR3DDR3LLPDDR2,不过内存频率还没有准确数据,三星Exynos5的DDR3频率达到了800MHz,Tegra4至少也该有这个水平。 续航与功耗:功耗减少45,TDP大约8W 新工艺的直接好处就是降低了处理器功耗,Tegra4的功耗号称比Tegra3减少了45,视频播放续航时间为14小时。 芯片的TDP参数未知,不过Heise从ProjectShield游戏机中估算了一下,它配备的是38Wh电池,续航时间是510小时(在掌机中这个续航算是很低了),因此功耗大约是3。87。6W左右,如果算上内存、WiFi之类的消耗,那么实际功耗在5W左右。 这个功耗是什么概念呢?结合之前Anandtech做过的芯片级功耗测试来看,三星的Exynos5250处理器的典型功耗在4W左右,最大功耗约为8W,因此四核的Tegra4控制的还算不错,只不过这个“不错”的前提只适用于配备大容量电池的平板上。 我们把ProjectShield游戏机看作一个5英寸720P、38Wh电池的手机,其游戏续航时间是510个小时,然后以小米2手机为参照对象,其电池容量为2000mAH,电压3。7V,电池容量是7。4Wh,在我们的测试中GLBenchmark放电时间是3小时27分,那么,使用与小米2手机同样容量电池的Tegra4手机游戏续航时间恐怕只有12个小时,只有小米2手机的一半左右,而且这还没考虑手机里各种信号芯片的消耗。 小米2满载时游戏续航时间大约是3个半小时 当然,这个换算是比较粗放的,手机平板的真实续航时间还要看屏幕以及厂商的优化,但是从NVIDIA官方给出的数据换算来看Tegra4用在手机上恐怕需要在续航上作出一些妥协。 GPU:非统一渲染架构,核心源于NV4x架构 Tegra4的CPU架构部分是基于CortexA15指令集的,32位ARM架构上NVIDIA还不会开发自己的指令,ProjectDenver计划的产品倒是有可能跟高通一样自主开发ARM兼容架构,所以Tegra4的CPU架构不做介绍了,GPU部分是NVIDIA自己开发的,这个才是重点。 先说Tegra4问世之前的一个小插曲。NVIDIA今年推出的Kepler架构功效非常高,一改Fermi时代的高发热高功耗旧貌,黄仁勋在公司内部邮件中表示Kepler架构如此高效甚至可以用到移动处理器上,而许多人确实很期待Tegra3之后的产品会升级到统一渲染架构。 等Tegra4露面了,统一渲染架构的设想已经被证实不可能了。NVIDIA市场总监NickStam证实,Tegra4的72个GPU核心由48个PS像素顶点单元和24个VS顶点着色单元组成,延续了Tegra23使用的GeForceULP核心,其中Tegra3上的PS、VS单元分别是8个、4个。Tegra4的规模正好是Tgera3的6倍,当然还有一些渲染管线以及缓存容量的调整,不过纹理单元规模没有提及。 GeForceULP架构源于GeForce67时代的NV4X架构,是2004年的产品了,PS3中使用的RSX架构其实就是GeForce7800GTX的NV47核心的改款。 Tgera3处理器的跑分,Tegra4在GLBencmark中的性能是前者的2。5倍左右 在统一渲染架构支持方面走的比较靠前的是PowerVR,SGX5系列开始就已经支持统一渲染架构了,这都是几年前的事了,新一代SGX6系列还会继续提升。 不过监NickStam认为,苹果的处理器中图形核心占据了太多面积,而实际游戏“并不是那么让人着迷”,而NVIDIA的长处不是堆硬件,而是软件和驱动优化,通过与游戏开发商的合作与优化是可以打败iPad的。 GPU虽然是NVIDIA的强项,但是Tegra23使用的都是很古老的核心,性能参数都低于同时代的移动处理器,Tegra4没想到也是如此 不管哪种种架构,具体的性能上NVIDIA宣传的都是6倍提升,具体的游戏测试中应该能达到34倍性能提升(NVIDIA语)。从日前曝光的性能测试来看,GLBenchmark2。5中现在的Tegra4跑分已经达到Tegra3的2。5倍左右,相当于A6X的62,优化之后得分应该还会有所提升。 API规范:不支持OpenCL也没有CUDA,甚至不支持OpenGLES3。0 GPU架构的硬件设计先不去管它,再来看Tegra4最为人诟病的地方那就是作为新一代的移动处理器,它竟然不支持现有的技术规范,GPU计算方面完全不支持OpenCL,NVIDIA自家的CUDA也不支持,图形规范上也不支持OPenGLES3。0(NVIDIA的宣传中都没提这一点,Heise上说的是不支持,应该还是停留在Tegra3的ES2。0规范上),微软的DX10DX11。1也不要指望了。 高通骁龙S4系列的处理器已经通过OpenCL这样的规范实现GPU和GPU同时加速性能提升,NVIDIA在这方面反倒保守了 BSN对这个问题很在意,特地询问了NVIDIA官方,后者在回复中表示:“现在的移动应用中根本无法利用OpenCL、CUDA以及更高级的OpenGL规范的优势,Tegra4的GPU性能非常强劲,我们的目标是致力于提高终端用户的真实体验。” NVIDIA没说出口的深层原因也许是Tegra4的GPU架构实在太老了,还是GeForce67时代的,那时候OpenCL以及自家的CUDA恐怕还在酝酿阶段,所以干脆不提这些技术规范了,这一举动也让BSN大加吐槽,这跟NVIDIA在桌面及HPC领域中推崇GPU计算的表现完全不符啊。 BSN还举例称不支持OpenCL这样的规范已经对NVIDIA的Tegra造成了影响,在宝马新一代硬件竞争中NVIDIA就败给了飞思卡尔,后者使用的Vivante图形核心支持最新的OpenGLES3。0以及OepnCL规范,而NVIDIA的不行,这就是他们出局的原因。 另外,不支持这些规范对NVIDIA未来的市场竞争也很不利,Futuremark即将推出新一代跨平台测试软件,Rightware的BasemarkX也会如此,他们都要求更高的API规范支持。实际上从CES展会上的现场测试来看也是如此,对OpenCL、OpenGLES3。0支持较好的高通APQ8064处理器手机以及iPad得分都比较靠前,而Tegra3处理器就非常靠后。 还有WindowsRT设备上的,高通的APQ8064、ARM的MaliT600系列已经支持DX11DX10规范。据说高通没能入选SurfaceRT平板处理器是因为当时他们没搞定驱动,所以微软才选了Tegra3,而且有消息表示下一代SurfaceRT平板将使用高通、AMD以及Intel的芯片,毕竟这三家的移动GPU核心对DX11规范支持的更好。 结语 在Tegra4没公开之前,传闻中的各种规格确实让人很兴奋,四核CortexA15核心,统一渲染架构,72个图形单元,支持DX11、OpenCL、OpenGL4。x以及CUDA规范,但是最终有些变成现实了,而有些落空了,特别是API规范方面与大家的预期相比是一落千丈。虽然NVIDIA嘴硬说这些规范没什么意义,他们更关注用户体验,但是作为新一代的移动处理器,Tegra4至少也要在市场上撑两年,别人已经支持的规范你却不支持,这在宣传上已经吃亏了。 还有就是Tegra4处理器的功耗和续航,作为一个四核CortexA15架构的处理器来说,48W的功耗跟现在的三星Exynos5双核差不多,看起来已经很不错了,不过三星的双核CortexA15处理器目前只用在了平板中,依然没能进入手机市场。目前使用Tegra4处理器的设备也主要是平板,用在智能手机上恐怕还得优化一下功耗管理,该降频就得降频。 最后就是上市时间了,这个问题甚至要比规格性能高低的影响还要大,目前能提供28nm四核处理器的主要是高通一家(其实国内的瑞芯也推出了28nm工艺的四核CortexA9处理器了),无论是平板还是手机,现在不用APQ8064都不好意思说自己是旗舰了。