英伟达已经在9月底发布了全新的RTX40系显卡,包括GeForceRTX4090显卡以及GeForceRTX4080显卡,其中最受大家关注的,同时性能也最为强劲的自然是GeForceRTX4090这款老大哥显卡,而在正式发布之后,关于RTX4090显卡的非议也是最小的,毕竟无论是规格还是实际体验,GeForceRTX4090显卡带给玩家的是无可争议的性能怪兽。 由于散热器设计的原因,目前绝大部分的GeForceRTX4090显卡的体积都比去年提升不少,尤其是包装是一个比一个夸张,当然市面上也有采用正常包装的显卡,比如说PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡,相比较其他家的显卡,PNY的这款显卡在提供强劲性能的同时也能确保显卡体积的相对小巧,起码包装看起来就十分地合理,现在就让我们一起来看看这款旗舰级显卡吧。 首先介绍下PNY这家品牌,或许大家对于内地的显卡品牌比较熟悉,而对于PNY比较陌生,事实上PNY为美国必恩威科技,名字取自于英文单词的巴黎和纽约,从1985年至今已经有37年的历史了,而PNY也是NVIDIA在北美的核心AIC之一,自然能够在第一时间拿到NVIDIA给予的最新的芯片,从而完成显卡的研发以及制造,在性能以及稳定性上毋庸置疑。 AdaLovelace架构简析 首先自然是AdaLovelace架构,作为以女程序员命名的GPU架构,AdaLovelace自然在架构上取得了新的改良,包括采用的第三代RTCore,第四代TensorCore以及改良的光流处理器,都为这一代显卡带来强劲的游戏表现,当然也包括暴增的流处理器规格以及基于TSMC4N工艺打造的超高核心频率。 以一颗完整的AD102为例,它拥有12个GPC,72个TPC,也就是拥有144个SM计算单元,每个计算单元是128颗流处理器,也就是说AD102拥有18432颗流处理器,除此之外AD102共有144个负责光线追踪的RTCore,576个TensorCore,576个TMUs以及192个ROPs,同时显存带宽为384bit,并且考虑到高压游戏所需要的高帧率,因此AD102的L2缓存也大幅提升至96MB,可以说从规模上来讲,AD102要比GA102高的太多。 从具体的性能上来看,AD102采用的着色器算力达到了83TFLOPS,是上代的两倍,光追算力达到了191TLOPS,是上代的2。8倍,而全新的第四代TensorCore则增加了FP8引擎,算力达到了1。32PFLOPS的张量性能,是上代的5倍。而这个张量性能也是为DLSS3所打下的算力基础。 除了上述这些理论测试之外,这一次RTX40系显卡最大的特点就在于改良的光流处理器,相比较上代能够提升1倍的性能,从而让GPU能够通过够预测场景中帧和帧之间的运动变化并提取其矢量信息,并且借助AI渲染出相应的画面,进而大幅减少GPU的渲染任务,NVIDIA表示借助DLSS3,可以让RTX40系显卡仅需渲染原来游戏八分之一的画面工作量,从而大幅提升游戏的帧率,当然DLSS3带来的副作用就是增加了渲染的队列,进而增加游戏的延时。 除此之外,对于专业用户来说,这一次AdaLovelace也带来了支持AV1编码的全新第八代NVIDIA编码器,能够在保持画质几乎相同的情况下拥有更小的视频容量,对于主播来说则如虎添翼。 和以往的显卡一样,这一代的GeForceRTX4090并非采用完整版的AD102核心,甚至相比较以往的旗舰核心拥有更高的缩水率,比如说GeForceRTX4090拥有128个SM单元,也就是16384颗流处理器,并且RTCore变成了112个,TensorCore与TMUs变成了512个,ROPs也变成了176个,不过显存带宽继续是384Bit,除此之外,用于RTX4090的L2缓存也变成了64MB,毫无疑问未来老黄将会为大家带来拥有更强规格的GeForceRTX4090Ti显卡,当然GeForceRTX4090仍然拥有卡皇级的图形性能表现。 显卡外观 首先要说的就是PNY的包装,今年GeForceRTX4090显卡的包装相信大家已经有所耳闻,那就是大,可以说就是以大为主,求大求全,由此让显卡的重量也重了不少。不过PNY显卡的包装在这么多RTX4090显卡中实属清流,体积要小上不少,跟传统的显卡包装相差不大。 为了压制AD102核心带来的庞大热量,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡搭载了三个100mm双滚珠风扇,与传统90mm风扇相比增加了40以上的风量,并且风压也提升了55,由此让散热效果更加显著。在信仰背板上,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡采用鋁製金屬背板,借助强化的架构,可以防止显卡PCB因为过重出现弯折的情况,此外借助大型的背板散热孔,可以让气流更快地带走热量,从而加快显卡的散热速度。 与其他RTX4090显卡一样,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡采用的是124Pin进行供电,其中12Pin负责供电,而4Pin负责信号交换,此外官方也提供了一根4X8Pin转12Pin的转换线,不过现在这些转接线或许有质量上的问题,会导致供电接口烧融,因此优先考虑采用124Pin的原生线缆。 整卡的三围为331。8x136。8x71。1mm,相比较其他厂商的4090显卡普遍长度在385。5m以上,这款显卡就显得更加迷你和小巧,进而能够塞下更多的机箱。当然考虑到散热器的实际体积,这款显卡仍然采用3。5槽的设计,与水冷显卡相比还是比较硕大。接口则为标准的3个Display1。4以及1个HDMI接口,对于发烧级玩家来说也是绰绰有余。 PNYGeForceRTX409024GBOCXLR8EPICXVERTO也支持RGB灯效,玩家可以通过VelocityX自定义ARGB灯光效果,创造出个人化的灯光体验。当然还可以借助这款软件来对显卡进行超频以及性能监控等行为,此外VelocityX也配置了OverClockScan,可以根据显卡的电气性能给予一个推荐的超频数值,让用户安全且稳定地进行超频。 作为一款旗舰级的显卡,PNYGeForceRTX409024GBOCXLR8EPICXVERTO在散热上还是比较下苦功夫,毕竟根据流传的信息来看,这款散热器目标是压制600W的TGP,而现在用于压制450W的AD102300,显然是有点过剩。 平台搭建 PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡是一款性能强悍的骨灰级显卡,为此我们搭载了IntelCorei912900K处理器,此外主板采用了ROG的Z690Hero主板,内存则是英睿达的DDR5内存,总容量达到了64GB。我们也选用了WDBLACKSN850以及WDBLACKSN770两款PCIe4。0SSD,从而最大程度地减少系统的瓶颈。 性能测试 理论性能 作为图形理论测试的首选,3DMark自然是最为流行的测试软件,通过FireStrike、TimeSpy以及RoyalPort分别测试显卡在DX11、DX12以及光追性能。自然我们也使用3DMark测试了PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的理论成绩,此外我们也将NVIDIAGeForceRTX3080Ti显卡作为对比。 毫无疑问,作为拥有目前显卡界最强大规格的PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡在性能上无疑是行业顶尖的水平,与上一代的RTX3080Ti相比,平均性能提升幅度在100左右,不过FireStrikeExtreme领先的幅度最不明显,这其中的原因自然就是CPU的性能在一定程度上限制了显卡性能的发挥。 实际游戏性能 相比较3DMark理论测试,实际游戏的性能差距才是大家更加关注的,毕竟很少有人买来极品显卡,就是为了跑分而不是用来玩游戏或者干视频渲染等活儿,并且与理论测试相比,实际游戏测试需要考虑的因素就太多了,包括特效设置,CPU内存的限制,以及驱动的优化等。考虑到游戏特效的不同,我们将评测的游戏分为传统的光栅化游戏以及光追游戏。 光栅游戏 对于光栅化游戏来说,很明显在实际游戏表现方面,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡相比较NVIDIARTX3080Ti的帧率提升幅度在65左右,与理论测试相比还是有一定的差距,这是由于传统的光栅化游戏并没有加入光线追踪等新技术,并且各大显卡对于光栅化特效已经吃透地相当的深,因此领先幅度没有想象之中的大。 光追游戏 而在光追游戏中,由于采用了第三代的RTCore,因此RTX40系显卡的表现更加出众,尤其是在4K分辨率这样的重压环境下,即使没有采用像DLSS3这样的黑科技,平均领先幅度也可以达到100,甚至部分游戏为120,不过像《孤岛惊魂6》这样的游戏,由于本身的优化一般,实际上领先幅度不是很大。 DLSS3 除了上述游戏性能之外,RTX40系显卡最大的特点就在于通过第二代光流处理器分析两帧连续的游戏图像,计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模,这样便可以大幅减少GPU的渲染工作量。具体点来说就是大幅提升游戏的帧率,尤其是一些采用全景光追的游戏来说更是如此,比如说《赛博朋克2077》这样的游戏,乃至于未来基于8K分辨率的游戏来说,DLSS3都大有可为。 目前游戏厂商研发的游戏对于DLSS3有着多个标注,其中主流的便是将DLSS3与DLSS2分别称之为DLSSFrameGeneration和DLSSSuerResolution,除此之外,考虑到DLSS3的工作原理,事实上DLSS3与NVIDIAReFlex相绑定,从而减少游戏的时延。 我们也测试了在DLSS3下的游戏帧率对比,就跟其他的显卡一样,在搭载最大程度的DLSS3特效下,性能提升幅度达到了23倍,比如说像《赛博朋克2077》这样的大作,可以轻松突破100帧,而原来甚至只有37帧,即使是最大程度的光线追踪也丝毫不怕。此外DLSS3实际上是基于DLSS2的画面插帧,而伴随着厂商对于DLSS的理解日益深入,事实上DLSS2的画面已经可以满足绝大部分玩家的需求,自然完全可以接受DLSS3的画质。 当然除了DLSS3足够给力之外,玩家们也希望能够知道游戏厂商究竟什么时候能够支持DLSS3。目前截至11月16日,总共有10款游戏可以游玩,这些游戏包括《瘟疫传说:安魂曲》、《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《F122》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模拟飞行》,未来也将有更多游戏加入到DLSS3之中。 创作者性能 除了游戏玩家之外,创作者玩家同样需要借助PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡强大的机能,包括对于AV1视频的编码,以及视频和图像渲染,借助强大的CUDA算力实现多款专业软件效率的极大提升。据统计,目前已经有超过75款创意应用可以使用CUDA的AI算力,我们在这里也选择几款专业软件来测试下PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡在专业领域能够带来怎样的惊喜。 首先是VRAY这款知名的图形建模渲染软件,在GPU测试中,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡取得了4161分的成绩,而在RTX光追渲染中,成绩为5450分,毫无疑问是目前性能最为强劲的几个型号之一。Octane也是一款渲染软件,可以借助NVIDIARTX显卡中的AI计算单元实现快速的交互式渲染,从而将渲染效率极具提升,达到数倍甚至于数十倍过去显卡的渲染性能。借助强大的RTXAI算力,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的总得分为1270分,同时单项渲染成绩更是达到了GTX980显卡的十余倍,性能无愧是卡皇的称号。 RTX40系显卡已经加入了AV1视频编码功能,对此我们选择了最新版本的达芬奇,同样可以完美支持AV1视频编码。通过测试,相比较传统的H。264格式的视频,基于AV1编码的视频可以在容量上更小,这对于主播来说则尤其重要。 可以看到借助强大的CUDA算力,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡可以在专业应用上取得无与伦比的成绩,当然需要注意的是,想要完全发挥这款显卡的专业性能,那么就要选择NVIDIAStudio驱动,GeForce游戏驱动并不能很好地发挥RTX4090的专业性能。 超频 对于RTX4090显卡来说,大部分还是出厂即灰烬,不过我们还是可以小超一下,利用OverClockScan,这款显卡的频率提升稳定点在200MHz附近。借助PNY官方的超频软件,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的核心频率可以轻拉高200MHz,默认状态下核心频率为2790MHz,而超频状态下则为2985Mhz。相比较默频,在超频状态下的性能提升大约为2。5,属于是小打小闹。 功耗和温度 我们也使用3DMark压力测试和实际游戏来测试PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的功耗和温度,并使用FrameView记录显卡的实际表现。 从表中可以看到,尽管PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的TGP为450W,但是实际功耗低于450W不少,最高也就在416W上下,尤其是开启DLSS3这样的特效之后,GPU的功耗甚至达到了362W,比TGP少了近90W,由此可见AD102核心的能耗比还是相当理想的。 除此之外PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡也支持自动停转的功能,当环境处于待机状态,同时GPU温度低于一定阈值(30摄氏度)的情况下,PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡将会停止风扇的转动,从而减少噪音,这时候GPU的温度为31摄氏度,并且整机的分贝数为31分贝。 而当我们运行《赛博朋克2077》也就是让GPU满载的时候,此时PNYGeForceRTX409024GBOCXLR8EPICXVERTO显卡的风扇转速大约为每分钟1320转,显卡的分贝仅为49分贝,GPU温度为65摄氏度。可以说得益于先进的散热单元与架构,即使是满载状态下也能提供相当安静的使用环境。当然你也可以使用软件将显卡的风扇拉到最高,此时风扇转速为3153转,GPU的温度下降至58摄氏度,分贝也飞跃至70分贝,显然是得不偿失的。 总结 毫无疑问,作为旗舰型的显卡,PNYGeForceRTX409024GBOCXLR8EPICXVERTO的性能符合预期,无疑是目前最为出色显卡之一,并且借助DLSS3等特效,即使是面对4K全景光追这样的游戏也是轻松应对,甚至可以达到144帧的速率。可以说DLSS3就是大家升级RTX40系显卡的最大动力。 当然除此之外,PNYGeForceRTX409024GBOCXLR8EPICXVERTO的散热表现也比较理想,最高温度仅在65度上下且十分安静,这对于一块旗舰级显卡来说比较难得。而且更加难得的是,显卡的长度宽度适中,并且外形也不是很浮夸,特别适合那些中等机箱的用户使用。 当然由于NVIDIA的限制,实际上显卡的TGP基本上就被设定在了450W左右,对于PNYGeForceRTX409024GBOCXLR8EPICXVERTO来说也不例外,但VelocityX的OCScan智能超频可以轻松让显卡的性能再往上提升。对于追求稳定的消费者来说;即使不超频也能碾压市面上99。9的游戏,PNYGeForceRTX4090值得一选。