GeForceRTX3050天梯榜首发评 - 肛瘘图片 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2022/12/12 20:49:00

NVIDIA在CES大展上，正式发布了GeForceRTX桌面版GPU。从最早的年末传出相关消息，到年初发布，期间多次传出NVIDIA推出该款GPU的时间，最后跨过了整个年我们终于看到这款显卡。相比于此前推出的GeForceRTX/RTXTi，这次桌面平台上的GeForceRTX更加贴近主流用户，而且首次将最新的光线追踪技术带到了“50”系列桌面GPU上。

NVIDIA表示，75%的游戏玩家依然在使用GeForceGTX显卡，而其中相当部分将是GeForceRTX的目标群体，其未来会取代GeForceGTX系列的位置。GeForceRTX的核心代号为GA-，仍然是基于GA核心，与GeForceRTX较为接近。

GA-核心介绍

GeForceRTX采用了新的GA-核心，其实就是把完整的具有3组GPC的GA核心屏蔽1组GPC而得来，故而一共具有10组TPC即20组SM单元，硅晶片的生产工艺依然是三星为NVIDIA定制的8nm工艺。

下面是GeForceRTX与GeForceGTX和GeForceRTX的规格对比表：

与上代同样定位的GTX相比，RTX宏观上最大的变化就是加入了TensorCore和RTCore，这是从0到1的质的变化，不仅如此，这一大步的变化还是直接就给用上了第三代TensorCore和第二代RTCore，正是如此飞跃性的提升，才让RTX也可能以入门卡的定位却还能胜任流畅运行光线追踪游戏的使命。

除了从0到1的的加入了TensorCore和RTCore，RTX相比GTX在其他方面的提升也非常巨大，制程工艺从12nm提升到8nm，CUDA单元数量从个提升到个，是GTX的将近3倍！纹理单元从56个增加到80个，光栅单元则保持32个不变。

显存部分RTX相比GTX提升非常巨大，显存类型从GDDR5进化到GDDR6，显存容量从4GB增长到8GB，在最能反映显存性能的显存带宽方面，从GB/s增长到GB/s，是GTX的1.75倍。

CUDA单元数量提升到将近3倍，显存带宽提升到1.75倍，还加入了第三代TensorCore和第二代RTCore，时钟频率也有一定幅度的提升，随之而来的，其价格和功耗也有一定幅度的提升，新的RTX的发售建议零售价为元，入门显卡已经来到两千元附近了，曾经几百上千元买个入门级游戏显卡的日子已经过去了，不过算上其性能的提升，其实性价比还是增加了很多很多的。

功耗方面，之前的GTX公版方案的功耗是75W，理论上可以做出无需外接供电的显卡，不过可能是受市场偏好的影响，实际的DIY市场上GTX显卡几乎没有见到无需外接供电的游戏显卡，而这一代RTX公版方案的功耗提高到W，理论上6pin的供电接口就够用了，不过实际估计也很难见到，绝大部分显卡应该都会配备8pin的供电接口。

最后，与RTX相比的话，除了频率之外，RTX的大部分规格都差不多是RTX的7成左右，作为入门的50系列与甜点定位的60系列，用传统的印象相比这个差距其实偏小，说明入门的RTX的性能保留的还是很不错的，不过这个差距幅度其实也与上一代的GTX与GTX差不多。

而基于新一代Ampere架构的GeForceRTX显卡也具有这一代Ampere显卡的一些通用特性，并且相比上一代Turing架构有很大的进步。

NVIDIAAmpere架构简介

SM单元的进化

RTX30系显卡上的SM单元相比RTX20系的，最大变化是加倍了针对传统计算的FP32单元、引入第二代RTCore以及第三代TensorCore。

大家都知道在Turing架构中，NVIDIA整数型（INT32）和单精度浮点型（FP32）两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32，因此为了提高计算效率NVIDIA在NVIDIAAmpere架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说，现在有两条不同的数据路径，一条能够同时处理整数或者单精度浮点，另一条则单纯处理处理单精度浮点计算。

负责进行实时光线追踪运算的专用硬件单元RTCore在NVIDIAAmpere架构上也更新到了第二代，最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率，官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上，第二代RTCore也可以比第一代快2倍。

TensorCore这个负责运行AI计算的硬件单元在NVIDIAAmpere架构上也升级到了第三代。其实之前发布的A计算卡上已经用上了新的第三代TensorCore，它能够提供比第二代TensorCore高出4倍的效能，不过游戏卡上面的TensorCore进行了一定的精简，其FP16FMA计算的吞吐量只有GA核心中的TensorCore的一半。

而第三代TensorCore带来的更强劲AI运算有些什么用呢?答案就是DLSS。DLSS的全称是DeepLearningSuperSampling，翻译成中文就是深度学习超级采样，它的作用是通过降低游戏内的渲染分辨率，同时以拉伸来提高显示分辨率，例如P的渲染分辨率以及4K（P）的显示分辨率，来达成提升帧数的目的。

此外，将不同类型的计算交给不同的单元去处理是从NVIDIAVolta架构就开始采纳的一种理念，当时引入的TensorCore分流了很多AI相关的运算，而在其后引入的RTCore又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行，到了Ampere架构上，NVIDIA提升了GPU内部各种单元之间的并行性，现在传统计算单元、RTCore和TensorCore这三大单元可以同时工作，在原本基础上继续缩短帧渲染时间。

再之后就是HDMI2.1这个备受期待的新输出端口了。在HDMI2.1之下，显卡可以用单线材做到8K60Hz或者4KHz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。

NVIDIAReflex

伴随RTX30系显卡一同发布的，有一个对于电竞游戏，或者更仔细地说对于电竞选手来说很重要的新东西，那就是NVIDIAReflex。那么这个NVIDIAReflex到底是什么东西呢？其实它是分为两部分的，一部分是硬件，一部分是软件。

硬件部分是ReflexLatencyAnalyzer，它其实可以视作为LDAT的一个进阶版本，是直接预安装在显示器里的，可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差，也就是整套系统的所有延迟。

而软件部分则是NVIDIAReflexSDK。这个NVIDIAReflexSDK的作用是降低以及测量渲染延迟的，开发者可以直接整合到游戏内。而在开启其低延迟模式后，可以让CPU与显卡同步，大幅度减少渲染序列，从而降低渲染延迟。

NVIDIABroadcast

NVIDIABroadcast是为直播主们推出的，这用到RTXGPU的AI能力来对直播主的背景消除或替换，还有摄像头重构图，甚至帮助麦克风进行背景噪音消除。

在安装了NVIDIABroadcast软件后，它会在摄像头、耳麦与直播软件之间建立一个中间者的角色，让外置设备可以利用到RTXGPU的AI能力来做一些AI增强效果，耳机和麦克风现在支持了降噪功能，AI会分析出哪些是主要音频，哪些是背景杂音进行降噪，给直播主和观众呈现清晰、有用的声音。

而摄像头现在有了自动重构图以及背景处理能力，从摄像头采集到画面，可以设置经过Broadcast进行处理，再传到OBS这些直播软件中，这可以让直播主的背景变得更为生动灵活，同时也可以降低直播场景的搭建成本。

华硕ROGSTRIXRTXO8GGAMING显卡外观

RTX并没有创始人版本，所有都是非公版出货，本次拿来做首发评测的是一张华硕ROGSTRIXRTXO8GGAMING，作为一张入门级型号的显卡，华硕ROGSTRIXRTXO8GGAMING看起来其实很威猛的。这与其隶属于ROGSTRIX这个高端系列有关。

华硕ROGSTRIXRTXO8GGAMING整体非常巨大，采用了明显的越肩设计，正面是三个大尺寸的轴流风扇，都是90mm规格的，均配备9片扇叶，配合其阻隔环的设计，可以将直接吹向显卡散热片的风量大大提升。

仔细观察扇叶，可以看到中央风扇的扇叶与两边风扇的方向是相反的，这种相邻风扇正反转的设计可以减少显卡散热器工作时候的空气乱流，以提高散热效能。除了增强散热效果之外，降低不必要的噪音也很重要，华硕ROGSTRIXRTXO8GGAMING具有待机停转功能，当核心温度较低时，散热风扇会一直保持静止，以得到绝对的静音。

翻到显卡背面，华硕ROGSTRIXRTXO8GGAMING具有与其PCB相比更长的金属背板，在完全覆盖PCB之余，还在显卡尾部形成了穿透式的通风设计，让经过散热鳍片的热风可以被吹向机箱风扇的风道，让整个机箱的散热风道更加合理。

并且华硕ROGSTRIXRTXO8GGAMING是具有两套风扇调节方案的，一个性能模式，一个是静音模式，玩家可以通过背板这里的小拨片一键调节，而无需通过软件进行设置，非常方便。

I/O挡板这边，华硕ROGSTRIXRTXO8GGAMING采用了不锈钢的支架，并且采用了比公版豪华些的视频输出接口设计，一共有2个HDMI接口和3个DP接口，HDMI接口是2.1版本的，可以支持8K60FPS的视频输出。

与这一代采用其他更高阶GPU型号的ROGSTRIX系列显卡相比，华硕ROGSTRIXRTXO8GGAMING在风扇直径和扇叶数量方面略有缩减，但是与其他同样搭配RTXGPU的显卡相比，华硕ROGSTRIXRTXO8GGAMING算是非常高端的配置了。

华硕ROGSTRIXRTXO8GGAMING显卡拆解

拆解后可以清楚的看到华硕ROGSTRIXRTXO8GGAMING的散热器与GPU接触的部分采用了镜面抛光处理，最大化提升平整度，以让其与GPU核心的接触呈现最紧密的状态，增加导热效率，提升散热效果。

连接纯铜底座与大面积散热鳍片的热管一共具有5根，均为6mm规格，进行了镀镍处理，可以很好的防止氧化。多处高发热的电子元器件部分都覆盖有高导热的导热硅胶贴，增加导热效果。

华硕显卡采用了全自动的生产线，所以PCB上非常的整洁，PCB上最显眼的肯定还是RTX的GA-核心，它周围有4颗显存颗粒环绕，均为美光的D9ZPM显存，这是GDDR6显存，等效数据速率14Gbps，单颗2GB容量、32bit的位宽，一共4颗组成8GB容量和bit位宽。

供电方面该卡采用了8相供电，其中6相供电给GA-核心，2相供电给显存，核心与显存供电的MosFET均是来自威世半导体的SiCA，PWM主控可以看到一颗uPR。

测试平台与说明

从GPU-Z可以看到，华硕ROGSTRIXRTXO8GGAMING显卡的基础频率为MHz，Boost频率为MHz，Boost频率相比公版方案有大幅度的预超频，显存等效数据速率为14Gbps，并且华硕ROGSTRIXRTXO8GGAMING的风扇具有待机停转的功能，通过GPU-Z的传感器监测页面可以看到待机状态下，风扇转速为零。

此外，华硕ROGSTRIXRTXO8GGAMING的默认温度上限是83摄氏度，玩家可以选择向上解锁到90摄氏度，由于Boost频率相比公版方案有大幅度的预超频，该卡功耗上限默认为W，高于公版方案的W，并且玩家还可以选择向上解锁到最大W。

测试平台如上表所示，主板采用的是ROGSTRIXZ-AGAMINGWIFID4吹雪主板，内存用两根XPG龙耀D50DDR4-GB组成双通道，其中BIOS设置方面，除了开启XMP让内存运行在MHz频率上之外，同时在主板BIOS中打开ResizableBAR的支持，其他均采用默认设置。

代表各款GPU型号的显卡分别是：XFX讯景RXXT黑狼版，4GB显存版本，Boost频率MHz；XFX讯景RXXT黑狼版；XFX讯景RX黑狼版，Boost频率MHz；EVGAGTXXCULTRA，4GBGDDR5显存，Boost频率MHz；华硕ROGSTRIXRTXO8GGAMING，Boost频率MHz；iGameRTXMiniOC12GL，采用公版BIOS档，Boost频率MHz。

3DMark理论性能测试

我们以3DMark作为显卡基准性能测试，测试项目包括FireStrike、FireStrikeExtreme、FireStrikeUltra、TimeSpy、TimeSpyExtreme以及PortRoyal六个项目。其中FireStrike、FireStrikeExtreme、FireStrikeUltra三个项目分别测试的是显卡在DX11游戏中的p分辨率、2K分辨率和4K分辨率下的性能指数，TimeSpy、TimeSpyExtreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数，PortRoyal是测试的显卡实时光线追踪的性能指数，具体成绩见下表，表中所列成绩均为3DMark显卡单项的得分。

由于参加测试的显卡中有4GB显存的显卡，并且性能羸弱，所以渲染分辨率相对高的项目中得分可能会有较大的波动，其中还是FireStrike项目的得分最具有参考意义。通过理论测试的结果可以认为，RTX相比GTX有至少70%的性能提升，而如果面对4GB显存不够的情况下，前者相对的提升还更大。

而与RTX相比，RTX大约有RTX的72%的性能，由于它们8GB和12GB的显存容量都足够充裕，所以每项测试项目中的差距都是这个数左右。

与竞争对手AMD刚出的新卡RXXT对比的话，还是注重看FireStrike项目，RTX似乎仅比RXXT高出5.6%的成绩，但是我们知道这一代A卡的理论测试成绩普遍相对其游戏实际成绩而言偏高，相信RTX的实际游戏成绩还是会比RXXT高出绝对不止5.6%的幅度，不仅如此，RTX的显存为8GB，相比RXXT充裕许多，也会使得它在对显存需求较大的游戏中有更好的表现。

不过，由于代表RTX的显卡是华硕ROGSTRIXRTXO8GGAMING，这张卡相比公版RTX的频率方案是有预超频的，所以的出来的性能结果相比公版RTX的频率方案是略有提升的，由于RTX并没有公版，具体提升不好估计，笔者根据经验判断可能提升有2%左右，这点也是要考虑到的。

P分辨率实际游戏测试

传统光栅化游戏画质对比测试

考虑到RTX的目的定位，这部分测试均将游戏画质设置为预设里面的高画质，不开启光线追踪、DLSS以及FSR，默认不是全屏的手动改为全屏，默认开启了垂直同步的手动关闭垂直同步，除此之外其他选项均为默认设置，均采用游戏自带的Benchmark输出结果。

统计多款的游戏实测结果可以得到，RTX相比GTX在游戏平均帧数方面提升高达77.9%，相比AMD上一代的RXXT提升达34.6%，相比AMD刚发布的RXXT提升达41%。大约为RTX和RX的75%。

实时光线追踪画质对比测试

这部分测试均将游戏画质设置为预设里面的高画质，并且将光线追踪开启至“高”，默认不是全屏的手动改为全屏，默认开启了垂直同步的手动关闭垂直同步，除此之外其他选项均为默认设置，均采用游戏自带的Benchmark输出结果。

游戏开启光线追踪的话，RTX的平均帧数是RTX的73.3%，与传统光栅化下的差距差不多，而与RXXT比的话，就比较复杂了，这涉及到RXXT本身光追性能羸弱并且显存只有4GB各方面的原因，不同游戏中表现的差距幅度差异较大，一个明显的规律是：越是光线追踪效果比较复杂的游戏设定下，RTX领先RXXT越多，甚至与RX都打的有来有回。

总的可以认为，RXXT是无法不借助FSR等技术在光线追踪效果下玩AAA大作的，而RTX则是有一定的可玩能力，并且在对性能要求较高的情况下，RTX的光追游戏表现甚至强于RX，在对性能要求不高的情况下，则是光追游戏表现弱于RX。

游戏实测方面由于与对比显卡的差距幅度较大，尽管笔者认为华硕ROGSTRIXRTXO8GGAMING相比公版RTX的频率方案可能提升有2%左右，在如此大的差距幅度下也对结论并无影响了。

RTX令人欣喜的游戏能力

上面的游戏测试中，一方面对比的显卡中有4GB显存的，这些显卡在如今AAA大作的预设最高画质下会出现显存不够的情况，有的会导致测试结果会出现较大波动，故而考虑到尽量实用且公平的情况下所有传统光栅化游戏画面均设置为高来进行测试，但是可以看到在预设高画质下RTX可以说游刃有余，还是可以继续挑战更高画质。

另一方面，实时光线追踪的游戏测试部分，尽管N卡拥有A卡不支持的DLSS，但是为了公平（渲染出一样的画面质量）N卡也没有开启DLSS，并没有完全体现出N卡的价值。综上，笔者对RTX又进行了一系列测试。

以下游戏测试的传统光栅化游戏画面均设置为预设最高画质，开启了实时光线追踪的均为光线追踪“高”设置，支持DLSS技术的均开启DLSS，支持DLSS2.1及以上版本的均开启至“性能模式”（所测游戏中，除了《尘埃5》和《孤岛惊*6》其他几款游戏均支持DLSS技术）。

此外默认不是全屏的手动改为全屏，默认开启了垂直同步的手动关闭垂直同步，除以上所述之外其他选项均为默认设置，且均采用游戏自带的Benchmark输出结果如下：

通过测试可以看到，传统光栅化游戏画面下，即使是如今很新的AAA大作，绝大部分RTX还是可以以最高画质流畅运行，而在借助了DLSS之后，光线追踪方面也可以都达到60帧左右的流畅度，表现非常的好。

温度表现：满载最高56.7摄氏度

温度测试是在裸机平台的环境下进行，环境温度约为19.7℃，使用3DMarkTimeSpy压力测试作为满载项目，数据通过GPU-Z的LogtoFile功能记录，以下为满载温度的测试曲线：

华硕ROGSTRIXRTXO8GGAMING具有风扇待机停转功能，所以上面测试的待机温度是风扇停转下的温度，尽管风扇停转，该卡的待机温度也非常的低，十分钟的待机过程中最高仅有35.9摄氏度，热点温度也最高才48.4摄氏度，非常的清凉，都没有触发风扇主动散热。

满载状态下，该卡最高温度仅仅才只有56.7℃，并且这个最高温度是触发风扇主动散热前的，风扇转动之后的温度都比这个还要低。