vncent 发表于 2022-2-7 09:43 只看TA 1楼 |
---|
|
[图帖] 【科技】【瑞虎探秘】微星超龙RTX 3080 Ti SUPRIM X评测 奢华之选[108P] 显卡终于不再是空气了!相信较为关注DIY市场的玩家一定都有所察觉,近日随着国家监管到位,虚拟货币的浪潮正在逐渐褪去,显卡价格也正在逐步回落。相信用不了多久,大家就能买到正价显卡了,今天给大家带来的是来自微星的超旗舰——超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡评测。![]() 微星GeForce RTX 3080 Ti SUPRIM X 12G 电商报价¥12799¥14999 RTX 3080 Ti是目前游戏卡,相较于RTX 3090来说,它的核心配置几乎与之相同,只是在显存方面有所减少,同时相对于RTX 3080来说又增加了2GB,在4K游戏中更加游刃有余。 SUPRIM是微星的超龙系列,定位超旗舰,也是微星在GeForce RTX 30系显卡中新发布的产品。首先我们还是先来看本次评测的微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读: 专利 显存专享散热通道 超旗舰 Boost频率达到1830MHz Tri Frozr 2S散热器,7热管豪华散热规格 总的来说,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡相比魔龙在外观上的细节更精致,正面导流罩的灯条设计让整个显卡看起来更像龙鳞,加上典雅的玫瑰金配色,超龙名副其实。在性能方面作为本代最强游戏卡,几乎任何3A大作在4K分辨率下都能流畅运行,并且12GB的大显存也兼顾了一定内容创作者需求。 ![]() 微星GeForce RTX 3080 Ti SUPRIM X 12G 京东商城 14999元 进入购买 01 旗舰核心GA102-225-A1 下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。 ![]() 第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti ![]() 第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。 第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 Tensor TFLOPS,而Turing为114 Tensor TFLOPS。 GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。 ![]() 完整的GA102核心 完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。 ![]() 为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。 02 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G外观 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在外观方面下了更大的功夫,相比魔龙和万图师整体给人的感觉更加内敛,但又蓄势待发的感觉。另外内部设计也更奢华,采用7热管的豪华散热设计加上新的显存专享散热通道,让超旗舰的规格更豪华。 ![]() 超龙GeForce RTX 3080 Ti SUPRIM X 12G 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的整体尺寸为336×140×61mm,配色采用黑色和玫瑰金相结合,而导流罩中央的玫瑰金部分采用金属拉丝工艺,两种材质的碰撞也更大气。 显卡正面采用三个10叶刀锋6代风扇主动散热,扇叶采用独特的环形设计,作为第2代TRI FROZR 散热系统的一个重要组成部分,能够进一步降低噪音,提高风压。 ![]() 风扇边缘的CNC切割工艺 在细节方面微星超龙GeForce RTX 3080 Ti SUPRIM X 12G更加不惜成本,风扇部位的导流罩边缘采用了CNC切割工艺,并且采用镀金处理。另外风扇中央不同于其他显卡的平面logo贴纸,而是采用了立体龙形logo贴。 ![]() 超龙GeForce RTX 3080 Ti SUPRIM X 12G背板设计 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的背板同样采用了玫瑰金的配色,并且表面采用双向拉丝纹理金属背板。 ![]() 显存专享散热通道 另外这款显卡在散热设计上,增加了显存专享散热通道,它使用了一根纯铜热管与专用散热片搭配作为显存模块的专享散热通道,从而可以把显存产生的热量快速传导至专用的散热鳍片。 ![]() 镜面铜工艺底座 整体核心的散热方式为特制的方形热管与镜面铜工艺底座紧密贴合,并穿插于整个散热鳍片,达到出色的散热效果。这种高工艺要求的散热方式相比热管直触导热更均衡,热量传导也更快,但相应的工艺更加复杂成本也更高。 ![]() 嵌入式的龙盾logo灯设计 ![]() 点亮后的logo效果 在显卡尾部的logo灯设计上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用镶嵌到背板的方式,给冰冷的金属加上一丝柔和的气息,同时对制作工艺的要求也更高。 ![]() 一键切换BIOS 在显卡侧面的供电接口旁边,有不同模式的BIOS调节,“SILENT”寂静模式和“GAMING”游戏模式,在SILENT模式下风扇转速相对保守,力求将噪音降至最低,GAMING模式下风扇转速提高,充分发挥性能。 ![]() 8*3pin的供电接口设计 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G供电接口为8*3pin,显卡最大功耗约为360W,想要购买的朋友需要注意电源是否匹配,并且是否支持3 PCIE接口。 ![]() 视频输出接口 在视频输出接口上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用DP 1.4*3 HDMI 2.1*1的公版方案,由于此次HDMI 2.1协议的使用,可支持单线8K的视频源传输。 ![]() 包装内附赠的显卡支架 另外由于RTX 30系显卡都比较厚重,单靠PCIE插槽和机箱挡板的固定并不保险,容易让金手指受损,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在包装盒内还附赠了一个金属显卡支架便于固定。 03 3DMARK理论性能测试 首先介绍一下测试平台,为了保证此次评测能够发挥微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。 ![]() 在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值(注:以下所有测试成绩均为默认的“GAMING”游戏模式)。 ![]() GPU-Z参数 首先看一下GPU-Z的参数,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1830MHz,而公版为1665MHz。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。 下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下: ![]() 3D MARK FS套装测试 在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的5张显卡进行分值对比,以便能更好的反应超龙GeForce RTX 3080 Ti SUPRIM X 12G的性能水平。 在该测试中可以发现微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的分数在FSE和FSU的测试项中甚至超越了RTX 3090成绩。 ![]() 3D MARK TS套装测试 而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G要全面超越RTX 3090,分数要高出2%左右,虽然不多,但也称得上越级提升;对比公版RTX 3080 Ti的话整体分数要高出6%左右;而对比上一代RTX 2080 Ti的分数要高出57%左右。 ![]() 3D MARK 光追测试 PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的分数同样超越了RTX 3090,达到了3%左右;对比公版RTX 3080 Ti的分数提升约为5%;对比上一代RTX 2080 Ti的分数提升则非常大,约为68%。 04 游戏性能测试 在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。 另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。 ![]() 《刺客信条:英灵殿》游戏测试 在《刺客信条:英灵殿》中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的成绩与理论测试中基本相符,由于CPU性能的限制,在1080P分辨率下成绩基本持平,而在2K、4K分辨率下相较公版分别有2帧提升。 ![]() 《德军总部新血脉》游戏测试 《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G超越了公版RTX 3080 Ti和公版RTX 3090的成绩。 ![]() 《孤岛惊魂5》游戏测试 《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G与另外两款同级别卡分数基本一致,只有1-2帧的差距,另外在4K分辨率下的成绩领先RTX 3080较多,达到21%左右。 ![]() 《无主之地3》游戏测试 《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。另外微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在4K分辨率下的分数有非常多的提升。 ![]() 《光明记忆:无限》游戏测试 《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。 ![]() 《边境》游戏测试 在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。 05 功耗及温度测试 功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。 ![]() 功耗测试(点击查看大图) 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G经过我们的实测在满载状态下单卡功耗为360W左右,满载频率为1935MHz左右,由于高频和供电更强,官方建议搭配860W及以上电源。 ![]() 温度测试 温度方面,本次微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在“GAMING”游戏模式下,经过1小时左右的拷机,温度稳定为68℃左右,显存温度为86℃左右,较公版有很大提升。 06 部分游戏光追及DLSS效果展示 上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。 ![]() 《赛博朋克2077》RTX ON(点击查看大图) ![]() 《赛博朋克2077》RTX OFF(点击查看大图) 在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。 ![]() RTX ON(点击图片查看大图) ![]() RTX OFF(点击图片查看大图) 在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。 ![]() 《堡垒之夜》RTX ON(点击查看大图) ![]() 《堡垒之夜》RTX OFF(点击查看大图) 堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。 ![]() 《魔兽世界9.0》RTX ON(点击查看大图) ![]() 《魔兽世界9.0》RTX OFF(点击查看大图) 《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。 ![]() 《控制》RTX ON(点击查看大图) ![]() 《控制》RTX OFF(点击查看大图) 《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。 ![]() 《赛博朋克2077》DLSS模式对比 DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。 ![]() 《逆水寒》DLSS模式对比 ![]() 画质说明 在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。 首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。 07 软硬兼施 铸就Ampere 好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。 NVIDIA Reflex 以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟? ![]() NVIDIA Reflex 在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。 以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。 NVIDIA Broadcast NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。 ![]() 宠物派对直播 这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。 ![]() NVENC编码 同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。 NVIDIA Studio 对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。 ![]() NVIDIA Studio NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。 ![]() 以GPU渲染为14.98秒 而CPU渲染为11分钟 当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。 08 梦幻升级 奢华之选 GeForce RTX 30系最强游戏卡,当然得配最强旗舰超龙,虽然本代产品有90型号,但其实GeForce RTX 3090从规格上来看完全就是前一代的TITAN,只是不知道NVIDIA为何会将这个型号归结为常规型号显卡中,也一直让大家误认为3090是游戏卡。如今RTX 3080 Ti的发布定位就是4K游戏,增加的显存也在这种超高分辨率上更有优势。 ![]() 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G 新的超旗舰超龙最让人印象深刻的地方要属它的细节部分,正面导流罩通过特定的弧度和角度设计,让它看起来更像龙鳞;而风扇部位的金属切割边缘,虽然不太起眼,但强大的细节往往就是体现在细微之处。另外嵌在金属背板表面的龙盾logo灯,无一不彰显着超旗舰不一样的身份。 ![]() 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G 在性能上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G基本已经完全超越公版GeForce RTX 3090,在4K分辨率下,可完美驾驭目前市面上绝大部分3A游戏大作。 此外RTX 30系显卡对于内容创作者来说也是极大的福音,更强的光线追踪与AI学习能力,在专业的创作软件中有着更明显的优势。虽然RTX 3090被冠以创作学习显卡,但在全新的NVIDIA Ampere架构下,加上NVIDIA Studio的软件加成,如果你不是要求极致地渲染8K素材,日常的专业软件使用也是完全没有问题的。 ![]() 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G 最后价格方面,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的京东旗舰店处于有货状态,价格为14999元,比魔龙贵1000元,感兴趣的朋友不妨点击下方链接详细查看。 产品图片 (13张) ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 产品图片 (19张) ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 官方图 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 ![]() 评测图解 转眼2020年已经接近尾声了,持续了将近一个季度的“显卡发布季”随着60型号的发布暂时告一段落,接下来A/N两家将着重更新移动游戏卡。整体来看30系显卡有着非常恐怖的性能飞跃,即使是RTX 3060 Ti这种甜品级显卡的性能都在RTX 2080 SUPER,也就是上一代的准旗舰之上。今天为大家带来的是索泰RTX 3060 Ti X-GAMING OC的评测。 ![]() 索泰GeForce RTX 3060Ti X-GAMING OC 电商报价¥3699 索泰RTX 3060 Ti X-GAMING OC采用了NVIDIA Ampere架构,相较于上一代的NVIDIA Turing架构有什么不同呢? ![]() 第一代RTX架构 Turing下的RTX 2060 SUPER ![]() 第二代RTX架构 Ampere下的RTX 3060 Ti 相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。 NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。 例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。 ![]() 《赛博朋克2077》 全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。 芯片虽然决定了显卡的性能和规格,但是显卡工作的整体稳定性,温度表现,噪音等级却更依赖显卡制造商在PCB布线,电子元器件的适配,散热系统调校等综合能力。 在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读: 粉蓝撞色外观,更加年轻活泼 超强性价比 满载64℃出色的散热设计 总的来说,索泰RTX 3060 Ti X-GAMING OC相比公版在散热方面做了很大改善,在整个RTX 30系显卡中拷机满载64℃也是少有的,作为老牌的AIC核心厂商,显卡素质让人绝对放心。同时全新的X-GAMING系列撞色设计赋予了显卡更年轻活泼的感觉。对于大部分玩家来说RTX 3060 Ti完全可以满足2K流畅的游戏体验,高性能低功耗的特点也让用户在升级显卡时不必大动干戈来更换电源。 01 索泰RTX 3060 Ti X-GAMING OC外观 在RTX 30系显卡中,索泰的X-GAMING系列外观全面改版,采用了年轻时尚的撞色设计。两种颜色的搭配堪称绝妙,不同色系的撞色搭配,不仅不会有违和感,两种色彩混合在一起还能给人清新时尚的感觉。 ![]() 索泰RTX 3060 Ti X-GAMING OC 索泰RTX 3060 Ti X-GAMING OC采用了粉蓝撞色设计,整体外观一改以往的冰冷金属风格,多了许多活泼元素,同时表面涂装略带磨砂质感,所以触手感觉也比较温和。 显卡的整体尺寸为331×118×53mm,相较上一代显卡没有明显增加,最主要的是厚度相较目前的非公版显卡控制的比较好。正面采用3个11叶盾鳞风扇,搭配智能启停设计,有效提升散热气流的流动效率,同时也更静音,延长风扇寿命。 ![]() 索泰RTX 3060 Ti X-GAMING OC供电接口 在显卡顶部,有倾斜的ZOTAC logo设计,相比以往的灯效来说,呈现的方式也更加活泼年轻化。索泰RTX 3060 Ti X-GAMING OC的供电接口位于logo灯上方,采用单8pin供电,由于这款显卡的自身功耗较小,实测满载仅为200W左右,对于想换新显卡又不想换电源的用户非常友好,推荐的电源为650W及以上。 ![]() 索泰RTX 3060 Ti X-GAMING OC背板 索泰RTX 3060 Ti X-GAMING OC的显卡采用铝合金背板,增强散热的同时,保护PCB不会弯折变形。并且同样采用粉蓝撞色设计,尾部印有白色的“X-GAMING”logo字样,中间镂空部位方便芯片散热。 ![]() 索泰RTX 3060 Ti X-GAMING OC 在显卡内部散热方面,采用了3热管+镜面抛光工艺接触传导,让散热模组与GPU之间的贴合更紧密,导热更高效,散热更迅速。 ![]() 索泰RTX 3060 Ti X-GAMING OC视频输出接口 视频输出接口上,索泰RTX 3060 Ti X-GAMING OC采用DP1.4a*3+HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。 ![]() 索泰RTX 3060 Ti X-GAMING OC 索泰RTX 3060 Ti X-GAMING OC的整体外观就为大家介绍到这里,下面我们来看看在新的NVIDIA Ampere架构下的RTX 3060 Ti是什么样的。 02 NVIDIA Ampere架构下的RTX 3060 Ti 索泰RTX 3060 Ti X-GAMING OC采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。 ![]() RTX 3060 Ti采用GA104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。 我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。 而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。 RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了4864这个惊人的数字。 而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。 ![]() 光追工作原理示意 在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。 而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。 ![]() RT Core的变化 在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。 ![]() 运动模糊渲染原理 第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。 ![]() 稀疏深度学习 Tensor Core可以看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。 在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。 首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。 与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。 虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。 ![]() 传统的数据交换 在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。 ![]() RTX IO可以极大解放CPU负担 当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。 同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。 03 3DMARK 理论性能测试 首先介绍一下测试平台,为了保证此次评测能够发挥索泰RTX 3060 Ti X-GAMING OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。 ![]() 在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。 ![]() GPU-Z参数 首先看一下GPU-Z的参数,RTX 3060 Ti采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有4864个CUDA,索泰RTX 3060 Ti X-GAMING OC的Boost频率为1680MHz,公版为1665MHz,有小幅提升。采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元为80和152。 下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下: ![]() 3D MARK FS套装测试 在针对显卡DX11性能的3DMARK FS套装测试中,我们主要对比索泰RTX 3060 Ti X-GAMING OC和RTX 2080 SUPER,整体来看在各项成绩中均小幅领先RTX 2080 SUPER;但差距不大。 ![]() 3D MARK TS套装测试 而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,索泰RTX 3060 Ti X-GAMING OC领先RTX 2080 SUPER更多,在TSE成绩中领先7%。 ![]() 3D MARK 光追测试 PortRoyal是3DMARK中专门针对光追性能的测试项,索泰RTX 3060 Ti X-GAMING OC的成绩相较RTX 2080 SUPER的成绩更高一些,但差距不明显。 在理论测试中,索泰RTX 3060 Ti X-GAMING OC可以说是RTX 2080 SUPER的OC版,不过两者的价格却相差不少,RTX 2080 SUPER比RTX 3060 Ti要贵将近2000元左右。 04 游戏性能测试 在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。 另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。 ![]() 《古墓丽影:暗影》游戏测试 ![]() 《古墓丽影:暗影》游戏测试 由于本次的参测显卡比较多,而古墓丽影分为标准测试和光追DLSS效果的测试,故分为两张表格进行对比,共2组6测。第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。 其中不难看出RTX 3080仍然遥遥领先,索泰RTX 3060 Ti X-GAMING OC也要小幅领先RTX 2080 SUPER的分数,但是差距不大。 ![]() 《德军总部新血脉》游戏测试 《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值。其中索泰RTX 3060 Ti X-GAMING OC比RTX 2080 SUPER在1080P分辨率下的分数高5%,2K分辨率下高15%;4K分辨率下高5%。 ![]() 《刺客信条:奥德赛》游戏测试 接下来是《刺客信条:奥德赛》,其中索泰RTX 3060 Ti X-GAMING OC比RTX 2080 SUPER在1080P分辨率下分数高2%;2K分辨率下高8%;4K分辨率下高4%。 ![]() 《孤岛惊魂5》游戏测试 《孤岛惊魂5》同样算是优化比较到位的3A大作,索泰RTX 3060 Ti X-GAMING OC比RTX 2080在1080P分辨率下分数高4%;2K分辨率下高12%;4K分辨率下高16%。 ![]() 《光明记忆:无限》游戏测试 《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。 ![]() 《边境》游戏测试 《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX 最高/DLSS 质量”下进行。 05 温度与功耗测试 在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。 ![]() 功耗测试(点击查看大图) 功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款甜品级显卡索泰RTX 3060 Ti X-GAMING OC的功耗要小得多,在峰值情况下整体平均在200W左右,与公版相同。 ![]() 温度测试 温度方面,本次的索泰RTX 3060 Ti X-GAMING OC经过10分钟左右的拷机,温度稳定为64-65℃,相对公版低了9℃左右,虽然X-GAMING的系列定位并不是旗舰,但在散热方面依然非常到位。 06 部分游戏光追效果展示 上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。 ![]() 《堡垒之夜》RTX ON(点击查看大图) ![]() 《堡垒之夜》RTX OFF(点击查看大图) 堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。 ![]() 《魔兽世界9.0》RTX ON(点击查看大图) ![]() 《魔兽世界9.0》RTX OFF(点击查看大图) 第二组对比来自最新的《魔兽世界9.0》,同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。 ![]() 《控制》RTX ON(点击查看大图) ![]() 《控制》RTX OFF(点击查看大图) 第三组对比为《控制》游戏,这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。 07 软硬兼施 铸就Ampere 好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。 NVIDIA Reflex 以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟? ![]() NVIDIA Reflex 在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。 以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。 NVIDIA Broadcast NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。 ![]() 它戳我脸! 这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。 ![]() NVENC编码 同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。 NVIDIA Studio 对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。 ![]() NVIDIA Studio NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。 ![]() 以GPU渲染为14.98秒 而CPU渲染为11分钟 当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。 08 悦动随心 娱见倾心 索泰RTX 3060 Ti X-GAMING OC显卡在外观方面充满了青春活泼元素,更时尚的撞色外观也更适合搭配侧透机箱来展示。 ![]() 索泰RTX 3060 Ti X-GAMING OC 在性能和售价方面,RTX 3060 Ti的成绩超越了上一代准旗舰显卡RTX 2080 SUPER,但定价却与RTX 2060相同,可以说即便是本代的甜品卡也拥有不俗的实力。 ![]() 索泰RTX 3060 Ti X-GAMING OC 虽然价格与20系相同,但全新的NVIDIA Ampere架构采用了第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,还拥有更高的能耗比。 另外从游戏方面来说,这款甜品卡同样有着非常恐怖的性能,完全可以满足在2K分辨率下的高帧率游戏体验,甚至部分游戏在4K分辨率下也可以保障60帧的流畅运行。 [ 本帖最后由 vncent 于 2022-2-7 09:44(GMT+8) 编辑 ] |
0 |