年,NVIDIA正式推出了RTX20系显卡,将游戏行业带到了光追世界,同时DLSS等AI技术的加入也让游戏的帧率有着一个相当程度的提高,老*也在当时表示20系显卡的出现是20年来游戏行业的最大进步。然而之后的事情相信大家都已经知道了,由于在传统性能上提升的幅度不够让人满意,而且支持光追的游戏也没有很多,反而价格相比较10代显卡提升不少,因此部分玩家对于首发的20系显卡尚持观望态度。
但等到了DLSS2.0之后,玩家们就大呼真香,RTX的威力也开始显现。当时大家还没想到,30系成为了NVIDIA新的杀手锏,等到NVIDIA正式公布30系显卡以及价格之后,大家才发现,原来NVIDIA有的是黑科技,而现在这些黑科技才陆续和大家见面。我们也在30系显卡发售之后第一时间拿到了NVIDIA的RTX显卡,现在是时候释放出这头性能怪兽,让大家感受下或许是近十年来性能最大的一次图形飞跃。
NVIDIAAmpere架构分析
在谈论这头图形怪兽之前,我们还是先来了解下30系显卡所采用的NVIDIAAmpere架构。在双倍的性能,双倍的快乐:英伟达RTX30系显卡架构解析这篇文章中,我们已经较为详细地向大家介绍了NVIDIAAmpere,在这里就再一次说明关于安培显卡的几个重点特性。
CUDA数量大幅提升
对于新一代显卡来说,架构的改进能够极大地提升显卡的性能,而光线追踪游戏的加入又让NVIDIA的显卡在架构上有着革命性的变化,这种变化在20系显卡中就已经初显端倪,NVIDIA在20系显卡中除了传统的FP32计算单元之外也额外加入了RT计算单元以及TensorCore计算单元,其中RT计算单元用于光追的计算,而TensorCore则能降低图形的渲染分辨率,然后再通过人工智能的方式进行图像优化,降低GPU的运算压力,让光追游戏更加流畅。
而到了30系显卡,NVIDIA又对NVIDIAAmpere架构进行了更新和改良,其中最大的改动便是更改了每个SM单元中的FP32单元。图灵架构中一个SM单元拥有一个FP32计算单元,此外还包括RTCore,TensorCore与INT32计算单元。而到了NVIDIAAmpere架构,NVIDIA在一个SM单元中除了设立了独立的FP32计算单元外,还额外让INT32与FP32共享一个计算单元,也就是说在NVIDIAAmpere架构显卡中,每一个SM单元的构成为独立的FP32和INT32与FP32的组合单元与TensorCore计算单元。
和图灵显卡相比,NVIDIAAmpere架构单个用于负责FP32计算的单元翻倍,因此消费者看到的是30系显卡相当夸张的单精度性能以及CUDA数量。其中RTX拥有个CUDA,RTX拥有个CUDA,RTX拥有个CUDA,让性能也能得到极大的提升,RTX的单精度浮点可以达到30T之多。
同时为了和30系显卡相匹配,全新一代的显卡也采用了美光最新的GDDR6X显存,全新的GDDR6X显存采用了四级脉冲幅度调制(PAM4)信令,可在不增加SGRAM功耗的情况下显着提高性能,让显卡拥有更高的显存带宽。
除此之外,NVIDIA在30系显卡上采用的是三星的8N定制工艺,和12nmFNN制程相比,三星8nm工艺可以带来更高的晶体管密度,从而在相同Die面积下塞入更多的晶体管。NVIDIA称RTX所采用的GA可以拥有亿个晶体管,这个数量是图灵显卡的1.5倍,而这多出来的晶体管自然是给RT单元、TensorCore以及FP32计算单元使用。
在硬件方面,NVIDIARTX拥有如此强悍的性能,除了规格之外,NVIDIA在另外一个重点介绍的是RTXIO,传统的存储设备的数据交换经常是以CPU为中心进行传输,而现在随着PCIeSSD的逐渐普及尤其是PCIe4.0SSD的崛起,CPU应付SSD的高数据流已经开始出现力不从心的情况,尤其是高帧率的游戏更是如此,于是RTXIO便应运而生。
RTXIO让GPU率先实现与存储设备的数据交换,不再需要占用CPU资源和宝贵的总线带宽,从而解放CPU的算力。得益于RTXIO,如果是PCIe4.0的SSD存储的游戏压缩数据,原本需要24核的CPU性能就只需0.5核的CPU性能就可以实现,同时还极大的节省了总线带宽,提升了游戏数据利用效率。这可以大幅提升游戏的加载速度,也从根本上解决了游戏容量越来越大,存储器速度越来越快的情况下的系统IO瓶颈。
可以说安培显卡通过这些全新的架构设计以及软件方面的更新换代让其获得了远超图灵显卡的性能,这也是让30系显卡成为近10年来性能提升幅度最大的产品的软硬件基础所在。
显卡规格参数
说完了强劲的新架构,接下来就要迎来这一次评测的主角也就是RTX了。我们拿到的是NVIDIA的公版RTX显卡。NVIDIARTX显卡拥有颗CUDA,光栅单元为96个,而纹理单元则为个,最高支持PCIe4.0的带宽,像素填充率为.2G像素/秒,纹理填充率则为.1G纹理/秒。此外RTX采用的是美光的GDDR6X显存,显存位宽为Bit,显存容量为40MB,总共拥有.3GB/S的显存位宽。
其他核心参数方面,RTX的核心频率为MHz,Boost频率为MHz,而显存频率为MHz,等效为19Gbps,可以说RTX的参数相当地豪华。
我们将RTX与RTX和RTXTi进行对比,发现RTX的参数是远超对手,更为重要的是和RTX以及RTX刚出来时候的爆炸价格相比,元的RTX显然更加地能被消费者所接受,也给了玩家留下了相当不错的好印象。
显卡外观
这一次我们拿到的是NV的RTXFE版本也是大家俗称的公版显卡,和以往的显卡相比,这一代的RTX可以说十分地精致。
我们先来看下RTX的外观,整体的线条十分地流畅,同时主题配色则是黑色与金色,展现了这款显卡的高贵与典雅,同时NVIDIA这次选用的是双风扇设计,只不过前后各放置一个,直径为9cm。
和之前的显卡相比,这一代的显卡在TDP上有着明显的提升,因此NVIDIA在散热上也下了苦功夫。采用的正反两面的双轴流风扇散热方案,能够提供强劲的散热的同时让显卡温度明显下降。
在供电接口上,RTX采用的是12Pin接口的供电设计,与传统的供电接口相比体积更加娇小,考虑到大家基本没有12Pin的供电线,因此官方附赠了一条双8Pin转12Pin的转接线,不过官方提供的转接线实在是太过于粗犷,与精致的RTX显卡似乎有点格格不入。
侧面是NVIDIA经典的RTX元素,同时灯光从绿色变成了白色,不过双8Pin转接线却把灯光牢牢挡住,有点无语。
这一次,NVIDIA在RTX上取消了Type-C接口,从而变成了传统的3DP+1HDMI接口。其中DP为1.4a,而HDMI则是最新的HDMI2.1。
显然RTX还是相当精致的,体现了这款显卡面向发烧级人群的定位,不过赠送的转接线是槽点十足,相信未来电源厂商将会为大家带来专门的12Pin供电线,从而提升显卡的整体颜值。
测试平台说明
RTX显卡是一款面向发烧级消费者的产品,因此在平台选择上我们尽量选择目前消费级市场能够使用的最强的配置。在CPU方面,我们将会使用IntelCorei9-K处理器作为主测试平台。
考虑到RTX显卡最高拥有PCIe4.0的传输速率,因此我们也采用了AMD的锐龙X作为PCIe4.0的测试平台,不但可以测试这款显卡在AMD平台的性能表现,也可以对比PCIe3.0与PCIe4.0之间的区别。而在其他的硬件选择上,我们也采用了发烧级的产品,比如说HyperX的掠食者内存,铠侠RD10以及WD_BLACKSN,此外在主板选择上也采用了M12E等顶级主板,可以说确保显卡发挥最强的水平。
另外NVIDIA推荐RTX显卡的玩家选用W以上的电源,而我们也采用了TT以及酷冷至尊的W电源,从而也确保了系统的稳定运行,在驱动选择上,我们采用的是NVIDIA的GeForce.16测试驱动,未来关于RTX显卡的性能表现将会随着驱动的变动而有所调整。除了RTX之外,我们也测试了RTXSuper以及RTXTi,看看RTX在性能上领先前辈多少。
理论测试
作为图形理论测试的首选,3DMark自然是最为流行的测试软件,通过FireStrike、TimeSpy以及RoyalPort分别测试显卡在DX11、DX12以及光追性能,自然我们也使用3DMark测试了RTX的理论成绩。
在3DMark的测试中,可以看到RTX相比较RTXSUPER的领先幅度相当地大,尤其是在光追测试也就是PortRoyal中,RTX领先幅度为86%,和RTXTi相比,RTX也有大约25-30%的性能提升。相比较RTX和RTXTi之间的对比,这个成绩还是让人满意的。
实际游戏测试
看完了3DMark的理论测试,相信大家对于这三块显卡的实际游戏测试也十分地感兴趣,当然理论测试只能说明显卡的理论图形性能,在实际游戏下,由于优化的区别,实际的游戏性能差距会更大或者更小,尤其是现在部分游戏加入了光追性能,更是让不同代数的显卡拥有更加惊人的差距,那么在实际游戏测试中,RTX和20系显卡相比能够领先多少呢?我们选择了DX11、DX12以及光追游戏分别进行测试,看看它们之间的实际游戏差距。
DX11游戏
作为传统的采用DX11引擎进行制作的游戏,这些游戏没有光线追踪以及DLSS,可以说比拼的就是显卡的传统图形性能对比也就是大家常说的FP32性能,那么在这些游戏测试中,RTX能够取得多大的领先呢?
《守望先锋》
《守望先锋》是由暴雪娱乐公司开发的一款第一人称射击游戏。以未来地球为背景,讲述人类、守望先锋成员和智能机械的恩怨纠葛。自然也是一款热门的网络游戏。我们将默认特效全部打开。
作为一款主流的电竞网游,《守望先锋》实际上对于显卡性能的要求不是很苛刻,说实话使用RTX显卡进行测试已经是大材小用了,而RTX的实际测试也十分地给力,在2K分辨率下的帧率达到了,而4K也有帧,已经超过了Hz的电竞屏的上限了。从这点也可以看出,随着GPU的发展,电竞显示器的门槛也应该有所提升了。这次随RTX30系列发布的Hz刷新率的电竞显示器也变成了职业选手的新装备,搭配NVIDIAReflex技术,还可以显著降低延迟。可以说RTX30系列将电竞装备又带上了一个新台阶。
《巫师3》
《巫师3:狂猎》是由CDProjektRED制作,WBGame、SpikeChunsoft发行的一款角色扮演类游戏,也是一款经典的DX11游戏,我们开启全特效包括NVIDIA毛发特效。
在《巫师3》的测试中,NVIDIARTX同样取得相当出色的成绩,在2K分辨率下也能取得超过帧的成绩,而4K分辨率也有87帧的成绩,领先RTXTi大约24.28%。
《刺客信条:奥德赛》
《刺客信条:奥德赛》是一款由育碧魁北克工作室开发,育碧发行的动作扮演类游戏。游戏设定于距《刺客信条:起源》故事发生前四百年的公元前年,讲述了古希腊城邦之间的伯罗奔尼撒战争的秘密虚构历史。《刺客信条:奥德赛》由于其糟糕的优化被玩家称之为“众生平等”,我们开启最高特效,同时开启Benchmark。
不得不说《奥德赛》就是《奥德赛》,即使是RTX领先幅度也只有RTXTi大约18%的幅度,不过在《奥德赛》中,RTX总算是超过了60帧。
《幽灵行动:断点》
《幽灵行动:断点》是一款设定于多样且充满敌意的开放世界下的*事射击游戏,并且完全支持单人或至多4名玩家合作游玩。玩家将探索最先进科技设施与野生自然环境共存的神秘岛屿“极光岛”,我们采用的是最高画质的画面设置。
和《刺客信条:奥德赛》相比,《幽灵行动:断点》的实际表现还算可圈可点,RTX的帧率超过了80帧,大幅领先RTXTi。
DX12/Vulcan游戏
目前采用DX11引擎的游戏越来越少,更多的厂商开始使用DX12引擎进行游戏的开发和制作,而且伴随着DX12引擎的将会是光线追踪以及DLSS,在这里我们进行纯DX12游戏的测试,此外像《DOOM》这样的游戏还使用Vulcan引擎进行制作,也算是《DOOM》游戏的传统艺能了。
《毁灭战士:永恒》
《毁灭战士:永恒》是一款由美国idSoftware开发,BethesdaSoftworks发行的第一人称射击类游戏。游戏是年游戏《毁灭战士》重启系列后的第二部作品。我们开启全特效。
由于采用了Vulcan引擎,而且《DOOM》对于游戏的优化也十分地到位,因此三款显卡的表现都相当地不错,其中RTX在4K分辨率下取得了帧的成绩,相当地不错。
《死亡搁浅》
《死亡搁浅》是一款由KojimaProductions开发,索尼互动娱乐于年11月8日发售的动作游戏。也是当时备受热议的游戏,可以说是小岛秀夫最新的力作,游戏讲述了主人公山姆必须勇敢直面因死亡搁浅而面目全非的世界,团结现存社会,拯救异空间人类的故事。我们在游戏中开启全特效,并且以性能模式打开DLSS。
《死亡搁浅》对于PC的优化十分地给力,尤其是配合DLSS功能,更是让游戏表现相当出色,RTX也在4K分辨率下取得了超过帧的成绩。
光追游戏
在NVIDIA推出RTX20系显卡的时候,NVIDIA对于光线追踪可谓浓墨重彩地进行了强调,尤其表示光线追踪的出现让游戏画面处于20年来最出色的时代,而在20系显卡推出两年之后,支持光线追踪的游戏也越来越多,在这里我们自然是以测试支持光线追踪的游戏为主,同时作为光线追踪的最佳伴侣,DLSS也是十分地重要,能够有效地降低游戏在光线追踪特效下的图形消耗。
《德*总部:新血脉》
《德*总部:新血脉》是一款由MachineGames开发,Bethesda发行的第一人称射击游戏。我们在测试的时候开启最大特效,并且也开启光线追踪以及DLSS。
《德*总部:新血脉》这款游戏在开启DLSS后,游戏帧率也是相当令人满意,其中RTX取得了超过帧的成绩。
《古墓丽影:暗影》
《古墓丽影:暗影》是一款由EidosMontreal工作室制作、SquareEnix出版的动作冒险游戏,该作将会是重启版《古墓丽影》的系列第三作。我们设定全特效与最高光追,并且开启游戏中的DLSS。
《古墓丽影:暗影》是最早支持光线追踪的游戏之一,而在实际表现中,RTX在DLSS中取得帧的成绩,相当给力。
《Control》
《Control》是一款由绿美迪娱乐制作、Games发行的一款第三人称动作冒险游戏。游戏的主要场景就发生在美国联邦控制局中,可以说控制是展现光线追踪效果最为出色的游戏之一。我们开启游戏的最大特效与光追效果,同时开启DLSS。
在《Control》中,即使开启DLSS,光线追踪对于图形资源的消耗也是有目共睹的,不过RTX凭借其出色的性能在4K分辨率下也能取得68帧的成绩,超过RTXTi大约36%的性能。
《战地5》
《战地5》是一款由EADICE工作室开发制作、EA(美国艺电)出版发行的第一人称射击游戏。游戏采用了寒霜引擎,展现了更强大的3D细节效果,把动画、环境破坏、光照、地图和音效提升到一个新的高度。我们开启最高特效,并且也开启DLSS。
《战地5》拥有出色的光线追踪效果,同时配合DLSS能够让RTX发挥最大的效果,而RTX不负众望,其性能超过RTXTi39%,甚至快达到了RTXSUPER两倍的性能。
《堡垒之夜》
《堡垒之夜》是一款第三人称射击游戏,海啸退去,昔日的堡垒世界被大水覆盖,全新海上时代正式开启!新赛季你可以在水面上建造,还有全新道具、水上载具助力你玩转水上战场。在最新的更新中,《堡垒之夜》增加了对于光线追踪的支持,同时也支持NVIDIA的Reflex技术。我们选用的是NVIDIA官方提供的RTX光追地图,开启全特效以及性能DLSS模式。
虽然《堡垒之夜》是一款网游,但是如果开启光线追踪,那么它也将是吞噬显卡性能的硬件杀手,在全光追特效下,几款显卡的图形压力呈现直线上升,不过配合DLSS,RTX在4K分辨率下取得了63帧的成绩,领先RTXTi大约50%,可见在未来的光追游戏中,DLSS将会是光线追踪特效的最佳搭档。
《光明记忆》
事实上除了国外游戏大厂之外,目前越来越多的国产游戏工作室也开始采用光线追踪的特效,为大家带来拟真的游戏环境,当然游戏对于显卡的需求还是十分苛刻的。《光明记忆》是飞燕群岛个人工作室制作的一款第一人称射击游戏作品。游戏故事内容以线性流程叙述,讲述超自然科学研究组织队员舒雅的冒险旅程。我们采用的是官方的Benchmark,开启最大光追特效,同时开启性能DLSS。
在《光明记忆》的测试中,RTX在4K分辨率中取得了57帧的成绩,虽然距离60帧还有一段距离,但是已经远远领先RTXTi,幅度达到了58%,十分地恐怖,而领先RTXSuper的幅度甚至达到了%。
《边境》
《边境》是一款近未来太空题材的第一人称射击游戏,带您领略真正的无重力战术射击体验。形形色色的太空操作员在近轨道相遇,打破常规束缚,让失重成为你的武器。我们同样开启最高光追特效以及性能DLSS。
在《边境》这款游戏中,RTX同样没有取得60帧的成绩,不过也领先了RTXTi36%的幅度。值得一提的是这两款游戏都用到了NVIDIAAmpere发布会上公布的光线追踪焦散,让游戏的光追细节更为逼真。通过上述测试可以发现,RTX的实际性能已经能够满足90%的4K分辨率需求,但是在部分光追游戏中,RTX似乎还力不从心。此外作为光追游戏的最佳拍档,DLSS可以说是流畅运行光追游戏的必备技术。如果没有DLSS加成,那么运行这些光追游戏将更加寸步难行。
温度和功耗
在实际测试中,我们经常会遇到一种情况,那就是游戏玩着玩着性能大幅下降,这是由于显卡散热不尽如人意所导致的GPU降频,因此一款显卡散热的好坏同样会影响到实际的显卡性能发挥。
我们使用Furmark对显卡进行温度测试,结果显示RTXFE公版显卡的温度为73摄氏度,已经比非公版的RTXTi温度更低,考虑到我们这一次采用的是非公版的RTXTi以及RTXSuper,因此和公版RTX显卡相比,温度控制领先幅度自然更加惊艳。
不过值得注意的是,这一次NVIDIA采用了最新的散热方式,因此整块显卡在满载运行时候的温度也相当地“给力”。我们使用FLIR红外成像仪进行测试,发现RTXFE的外壳温度为70摄氏度,出风口更是达到了73.4摄氏度,在更换显卡的时候,可以很明显地感到灼热感,因此给RTXFE选择一个庞大的机箱是十分有必要的。
而在功耗测试中,我们选用的是Furmark与《刺客信条:奥德赛》分别来测试在拷机和游戏环境下的功耗表现,使用功耗仪来测试整机功耗。结果RTX不负众望,满载的整机功耗达到了瓦,而整机的峰值功耗更是达到了瓦,因此想要稳定运行RTX显卡的话,一款W的电源是起步,要是配合锐龙X这样的CPU,那么电源的功率就需要W甚至W。
PCIe4.0与3.0的差别
这一次NVIDIA首次让RTX中支持PCIe4.0的传输通道,而目前唯一能够支持PCIe4.0的平台显然就是AMD的系锐龙平台,而英特尔这边根据消息也要到11代酷睿处理器才开始支持,相信有很多人会发布这样的疑问,那就是在PCIe3.0和PCIe4.0通道下,性能究竟相差多少。对此我们也采用了AMD和Intel两款不同的平台进行测试,看看在不同带宽下,RTX的实际表现究竟如何。
左Intel平台右AMD平台
我们采用3DMarkTimeSpy和《古墓丽影:暗影》进行对比测试,结果在AMD平台中,TimeSpy的图形分为分,而Intel平台为6分,两者相差3%,而到了《古墓丽影:暗影》中,AMD平台和Intel平台都为帧,渲染总帧数则相差0.27%。通过测试,我们可以看到,RTX在两个平台的实际性能表现处于伯仲之间,PCIe3.0和PCIe4.0的带宽差距在实际游戏表现上很难体现。由于目前微软的DirectStorage尚未推出,第一批支持DirectStorage和RTXIO的游戏也要等到明年,因此目前来看,PCIe3.0和4.0在游戏方面的差异基本可以忽略。
NVIDIABroadcast
而在这一次的发布会上,NVIDIA除了推出30系显卡之外,还推出了许多的新软件,比如说NVIDIABroadcast这款软件,NVIDIA当时表示玩家可通过这个软件,将自己的家改造成直播室,支持RTX加速的人工智能效果,比如噪音消除、虚拟背景、自动框显,从而提升麦克风和网络摄像头的效果。
在安装NVIDIABroadcast的过程中,需要注意的是,尽管有完整的安装包,但是仍然需要下载相应的组件,取决于消费者网络的流畅与否,因此在安装过程中或许会很长,或许也会很短。
目前NVIDIABroadcast还处于Beta阶段,因此很多功能还处于改良之中。在NVIDIABroadcast之中,最受人