NVIDIA官方宣布,将于当地时间2022年3月21日,在加州圣何塞,举办新一届春季GTC图形技术大会,创始人兼CEO黄仁勋照例发表主题演讲。
此外,NVIDIA CTO Macheal Kagan、研发高级副总裁兼首席科学家Bill Dally、机器学习总监Anima Anandkumar、副总裁兼加速计算首席总监Ian Buck、医疗健康副总裁Kimberly Powell等高管也都会登台演讲。
微星GeForce RTX 3080 Ti SUPRIM X 12G
电商报价¥12799¥14999
NVIDIA GTC大会一般聚焦于HPC、AI、自动驾驶方面的新硬件、软件,这次更是特别侧重深度学习领域。
虽然这次不可能有RTX 40系列游戏卡的消息,但几乎肯定会公布基于下一代计算架构“Hopper”,以及相应的加速计算卡方案。
微星GeForce RTX 3080 Ti SUPRIM X 12G 三区域光效,刀锋6代风扇,空气动力学,核心7热管
京东商城
14999元
进入购买
Hopper的名字来自赫柏,伟大的女程序员,被誉为编译之母。
此前消息显示,Hopper架构芯片已经流片,猜测顶级核心会叫做GH100,将在NVIDIA历史上第一次采用MCM多芯封装,内部集成两颗芯片,预计总共拥有288个SM流式多处理器,相比A100增加多达2.6倍,同时内部结构也会大改,制造工艺则有望是台积电5nm。
AMD CDNA2/RDNA3、NVIDIA Xe-HPC也都会是类似的MCM多芯封装,其中基于CDNA2架构的Instinct MI250/MI250X计算卡已经率先发布,6nm工艺,双芯设计,使用2.5D EFB桥接技术,业内首创多Die整和封装(MCM),最多14080个流处理器核心、880个第二代矩阵核心,搭配8192-bit 128GB HBM2e。
至于下一代游戏GPU,代号据传是“Ada Lovelace”,诗人拜伦唯一合法的女儿,被誉为第一位计算机科学家,编写了历史上第一个计算机程序,工艺也是5nm,发布时间预计会在今年第三季度。
显卡终于不再是空气了!相信较为关注DIY市场的玩家一定都有所察觉,近日随着国家监管到位,虚拟货币的浪潮正在逐渐褪去,显卡价格也正在逐步回落。相信用不了多久,大家就能买到正价显卡了,今天给大家带来的是来自微星的超旗舰——超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡评测。
微星GeForce RTX 3080 Ti SUPRIM X 12G
电商报价¥12799¥14999
RTX 3080 Ti是目前游戏卡,相较于RTX 3090来说,它的核心配置几乎与之相同,只是在显存方面有所减少,同时相对于RTX 3080来说又增加了2GB,在4K游戏中更加游刃有余。
SUPRIM是微星的超龙系列,定位超旗舰,也是微星在GeForce RTX 30系显卡中新发布的产品。首先我们还是先来看本次评测的微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读:
专利 显存专享散热通道
超旗舰 Boost频率达到1830MHz
Tri Frozr 2S散热器,7热管豪华散热规格
总的来说,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡相比魔龙在外观上的细节更精致,正面导流罩的灯条设计让整个显卡看起来更像龙鳞,加上典雅的玫瑰金配色,超龙名副其实。在性能方面作为本代最强游戏卡,几乎任何3A大作在4K分辨率下都能流畅运行,并且12GB的大显存也兼顾了一定内容创作者需求。
微星GeForce RTX 3080 Ti SUPRIM X 12G
京东商城
14999元
进入购买
01 旗舰核心GA102-225-A1
下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。
第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti
第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 Tensor TFLOPS,而Turing为114 Tensor TFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。
02 微星超龙GeForce RTX 3080 Ti SUPRIM X 12G外观
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在外观方面下了更大的功夫,相比魔龙和万图师整体给人的感觉更加内敛,但又蓄势待发的感觉。另外内部设计也更奢华,采用7热管的豪华散热设计加上新的显存专享散热通道,让超旗舰的规格更豪华。
超龙GeForce RTX 3080 Ti SUPRIM X 12G
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的整体尺寸为336×140×61mm,配色采用黑色和玫瑰金相结合,而导流罩中央的玫瑰金部分采用金属拉丝工艺,两种材质的碰撞也更大气。
显卡正面采用三个10叶刀锋6代风扇主动散热,扇叶采用独特的环形设计,作为第2代TRI FROZR 散热系统的一个重要组成部分,能够进一步降低噪音,提高风压。
风扇边缘的CNC切割工艺
在细节方面微星超龙GeForce RTX 3080 Ti SUPRIM X 12G更加不惜成本,风扇部位的导流罩边缘采用了CNC切割工艺,并且采用镀金处理。另外风扇中央不同于其他显卡的平面logo贴纸,而是采用了立体龙形logo贴。
超龙GeForce RTX 3080 Ti SUPRIM X 12G背板设计
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的背板同样采用了玫瑰金的配色,并且表面采用双向拉丝纹理金属背板。
显存专享散热通道
另外这款显卡在散热设计上,增加了显存专享散热通道,它使用了一根纯铜热管与专用散热片搭配作为显存模块的专享散热通道,从而可以把显存产生的热量快速传导至专用的散热鳍片。
镜面铜工艺底座
整体核心的散热方式为特制的方形热管与镜面铜工艺底座紧密贴合,并穿插于整个散热鳍片,达到出色的散热效果。这种高工艺要求的散热方式相比热管直触导热更均衡,热量传导也更快,但相应的工艺更加复杂成本也更高。
嵌入式的龙盾logo灯设计
点亮后的logo效果
在显卡尾部的logo灯设计上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用镶嵌到背板的方式,给冰冷的金属加上一丝柔和的气息,同时对制作工艺的要求也更高。
一键切换BIOS
在显卡侧面的供电接口旁边,有不同模式的BIOS调节,“SILENT”寂静模式和“GAMING”游戏模式,在SILENT模式下风扇转速相对保守,力求将噪音降至最低,GAMING模式下风扇转速提高,充分发挥性能。
8*3pin的供电接口设计
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G供电接口为8*3pin,显卡最大功耗约为360W,想要购买的朋友需要注意电源是否匹配,并且是否支持3 PCIE接口。
视频输出接口
在视频输出接口上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用DP 1.4*3 HDMI 2.1*1的公版方案,由于此次HDMI 2.1协议的使用,可支持单线8K的视频源传输。
包装内附赠的显卡支架
另外由于RTX 30系显卡都比较厚重,单靠PCIE插槽和机箱挡板的固定并不保险,容易让金手指受损,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在包装盒内还附赠了一个金属显卡支架便于固定。
03 3DMARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥微星超龙GeForce RTX 3080 Ti SUPRIM X 12G显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值(注:以下所有测试成绩均为默认的“GAMING”游戏模式)。
GPU-Z参数
首先看一下GPU-Z的参数,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1830MHz,而公版为1665MHz。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的5张显卡进行分值对比,以便能更好的反应超龙GeForce RTX 3080 Ti SUPRIM X 12G的性能水平。
在该测试中可以发现微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的分数在FSE和FSU的测试项中甚至超越了RTX 3090成绩。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G要全面超越RTX 3090,分数要高出2%左右,虽然不多,但也称得上越级提升;对比公版RTX 3080 Ti的话整体分数要高出6%左右;而对比上一代RTX 2080 Ti的分数要高出57%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的分数同样超越了RTX 3090,达到了3%左右;对比公版RTX 3080 Ti的分数提升约为5%;对比上一代RTX 2080 Ti的分数提升则非常大,约为68%。
04 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的成绩与理论测试中基本相符,由于CPU性能的限制,在1080P分辨率下成绩基本持平,而在2K、4K分辨率下相较公版分别有2帧提升。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G超越了公版RTX 3080 Ti和公版RTX 3090的成绩。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中微星超龙GeForce RTX 3080 Ti SUPRIM X 12G与另外两款同级别卡分数基本一致,只有1-2帧的差距,另外在4K分辨率下的成绩领先RTX 3080较多,达到21%左右。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。另外微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在4K分辨率下的分数有非常多的提升。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
05 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G经过我们的实测在满载状态下单卡功耗为360W左右,满载频率为1935MHz左右,由于高频和供电更强,官方建议搭配860W及以上电源。
温度测试
温度方面,本次微星超龙GeForce RTX 3080 Ti SUPRIM X 12G在“GAMING”游戏模式下,经过1小时左右的拷机,温度稳定为68℃左右,显存温度为86℃左右,较公版有很大提升。
06 部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克2077》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
07 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
08 梦幻升级 奢华之选
GeForce RTX 30系最强游戏卡,当然得配最强旗舰超龙,虽然本代产品有90型号,但其实GeForce RTX 3090从规格上来看完全就是前一代的TITAN,只是不知道NVIDIA为何会将这个型号归结为常规型号显卡中,也一直让大家误认为3090是游戏卡。如今RTX 3080 Ti的发布定位就是4K游戏,增加的显存也在这种超高分辨率上更有优势。
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G
新的超旗舰超龙最让人印象深刻的地方要属它的细节部分,正面导流罩通过特定的弧度和角度设计,让它看起来更像龙鳞;而风扇部位的金属切割边缘,虽然不太起眼,但强大的细节往往就是体现在细微之处。另外嵌在金属背板表面的龙盾logo灯,无一不彰显着超旗舰不一样的身份。
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G
在性能上,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G基本已经完全超越公版GeForce RTX 3090,在4K分辨率下,可完美驾驭目前市面上绝大部分3A游戏大作。
此外RTX 30系显卡对于内容创作者来说也是极大的福音,更强的光线追踪与AI学习能力,在专业的创作软件中有着更明显的优势。虽然RTX 3090被冠以创作学习显卡,但在全新的NVIDIA Ampere架构下,加上NVIDIA Studio的软件加成,如果你不是要求极致地渲染8K素材,日常的专业软件使用也是完全没有问题的。
微星超龙GeForce RTX 3080 Ti SUPRIM X 12G
最后价格方面,微星超龙GeForce RTX 3080 Ti SUPRIM X 12G的京东旗舰店处于有货状态,价格为14999元,比魔龙贵1000元,感兴趣的朋友不妨点击下方链接详细查看。
随着NVIDIA GeForce RTX 3070的性能解禁,越来越多的厂商推出了自己不同系列的产品,此前我们为影驰进行过GeForce RTX 3080黑将的评测,今天为大家带来的是影驰GeForce RTX 3070 GAMER OC的评测。
影驰GeForce RTX 3070 GAMER OC
电商报价¥4399
RTX 3070的推出可以说让20系显卡的中高端产品完全退出了历史舞台,而且不同于RTX 3080/3090的一卡难求,在供货量上RTX 3070也算是诚意满满。
作为历代最受欢迎的型号“70”显卡在性能上做到了中高端的水准,而价格却是实打实的降下来了,公版3899元相比旗舰级RTX 3080 5499元便宜1600元。对于普通玩家来说省下来的1600元还能再买一颗CPU,而从性能上来说,RTX 3070也让绝大部分3A游戏迈入了4K流畅的门槛,完全够用。
影驰 GeForce RTX 3070 GAMER OC
在我们公版卡的评测中,通过NVIDIA Ampere架构所带来的性能暴涨,RTX 3070的性能已经比肩昔日万元卡皇,此次影驰GeForce RTX 3070 GAMER OC能领先RTX 2080 Ti多少,下面为大家带来这款显卡的评测。
在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
导流罩部分采用乐高基座设计,玩家可自由DIY
高性能低功耗,与20系显卡功耗相仿,但性能提升巨大
满载拷机66℃,优秀的散热表现
影驰 GeForce RTX 3070 GAMER OC
总的来说,影驰 GeForce RTX 3070 GAMER OC显卡有着高频和可DIY的特点,尤其这次创新的在显卡导流罩部分采用了乐高基座设计,把外观定制化的部分交给玩家自己,只要你有想法有创意,就能DIY出属于自己独一无二的显卡。在游戏方面,这款的性能也让玩家可以充分调节游戏特效,4K流畅依然不是问题。而高性能低功耗的特点,也让大部分玩家可以直接升级显卡无需担心电源问题。
影驰GeForce RTX 3070 GAMER OC
京东商城
4399元
进入购买
01 影驰 GeForce RTX 3070 GAMER OC外观
如何将显卡玩起来,是现阶段留给厂商越来越困难的话题,当大家不再满足千篇一律的外观时,定制化产品也是每个厂商都要面对的。玩家希望通过定制化来彰显自己的风格,但定制化谈何容易。
在选购显卡时,我们经常抱怨,为什么显卡翻来覆去都是那几个样子,甚至有一些厂商在不同系列之间都很难看出差别。就是因为重新开模重新设计的成本巨大,任何细微的改动都要耗费资金更改模具。而面对这种问题,影驰想出了聪明的办法,就是交给玩家自己。
由乐高组成的GTX 690显卡
还记得在600系显卡的时代,有一名高玩用乐高拼出了完全还原的GTX 690显卡吗,但那个显卡只能作为展示用,并不具备真正的显卡功能。而影驰在RTX 30系显卡中推出的GAMER系列则颠覆了显卡的外观设计。
影驰 GeForce RTX 3070 GAMER OC
全新的影驰RTX 30 GAMER系列显卡外观借鉴了积木墙的设计方式,默认情况下是上图中的外观,正面导流罩部分覆盖三个透明亚克力罩,而且两侧的红蓝部件均可拆卸,看到这配色是不是让你有些联想到switch的手柄呢?
DIY后的影驰 GeForce RTX 3070 GAMER OC
将亚克力罩拆下后影驰GeForce RTX 3070 GAMER OC的真容就是这样,我们找来一些乐高块实验了一番,孔距和基座的大小非常吻合,不会出现很难插拔的情况。当然由于时间的关系我们只简单拼了个俄罗斯方块游戏的图案(我才不会说是我们拼不好),更多有创意的想法玩家可以自己DIY。
影驰 GeForce RTX 3070 GAMER OC
影驰GeForce RTX 3070 GAMER OC显卡的整体尺寸为337×135×53mm,采用3个90mm的11叶三折静霜扇叶,可将更多气流吸入散热器内实现进风量的进一步提升,内部为6根6mm镀镍复合热管,高效导热。
影驰 GeForce RTX 3070 GAMER OC背板
影驰GeForce RTX 3070 GAMER OC的背板同样采用了红蓝装饰配色,不知道是任天堂赋予了这种配色魔力还是本身如此,整体的游戏风扑面而来。
影驰 GeForce RTX 3070 GAMER OC背板插槽
另外在显卡尾部的多孔散热设计,既可以让显卡有更好的散热效果,同样也可以进行适量的乐高拼插,不过不建议过多遮挡通风孔。
影驰 GeForce RTX 3070 GAMER OC供电接口
供电方面,影驰GeForce RTX 3070 GAMER OC采用8 8pin的传统供电方案,而且这款显卡的TGP为240W,相比RTX 3080要小很多,如果你的现有电源为650W或更高,可以直接升级,无需更换电源。
故障指示灯
这一代的影驰GeForce RTX 3070 GAMER OC在背板处还有电源指示灯,判断电源是否接通,白灯为正常工作,红灯为连接故障,方便玩家排查故障。
ARGB同步线接口
另外在侧面的RGB logo灯顶部,可通过ARGB同步线连接主板,用魔盘软件XTAEME TUNER调节不同的灯光设置,目前支持四大板厂的灯光同步。
影驰 GeForce RTX 3070 GAMER OC挡板
视频输出接口方面影驰GeForce RTX 3070 GAMER OC采用DP1.4a HDMI 2.1的4接口设计,新的HDMI 2.1接口可支持单线8K视频源输出。同时显卡挡板采用了标准的2槽厚度,加上几何镂空设计,可加大出风口面积。
附赠的显卡支架
最后鉴于此次RTX 30系显卡的重量,影驰还附赠了透明亚克力的显卡支架,另外支架与显卡和机箱接触的部分还贴心的赠送了橡胶防滑贴,一来增加支架的稳定程度,二来可以防止刮花显卡和机箱。
02 NVIDIA Ampere架构下的3070
影驰 GeForce RTX 3070 GAMER OC同样采用了NVIDIA Ampere架构,我们首先来看一下相较上一代20系显卡的提升。
第一代RTX架构 Turing下的2070
第二代RTX架构 Ampere下的3070
相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3070中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3070的着色器性能达到20.3 TFLOPS单精度性能,而Turing为7.9 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到39.7 RT TFLOPS,而Turing为23.8 RT TFLOPS。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达162.6 Tensor TFLOPS,而Turing为60.3 Tensor TFLOPS。
RTX 3070的GPU核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3070中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3070采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3070共有5888个CUDA,其实它只有2944个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了5888这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏有帮助吗?答案是有,不仅有提升还很大。其实通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
03 3D MARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥影驰 GeForce RTX 3070 GAMER OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,影驰 GeForce RTX 3070 GAMER OC采用了GA104核心,三星8nm,芯片面积392平方毫米,相比RTX 3080的628小了236平方毫米,拥有5888个CUDA,频率为1500-1800MHz,而公版为1725MHz,显存方面与20系显卡相同,采用了8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元分别为96和184。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,影驰 GeForce RTX 3070 GAMER OC相较RTX 2080Ti互有胜负,赢面更大一些;但是相比RTX 2070的提升非常大,在FS中分数高49%,在FSE中分数高55%,在FSU中分数高63%。
而影驰 GeForce RTX 3070 GAMER OC与公版RTX 3070的差值比较稳定,均在4%左右。
3D MARK TS套装测试
在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰 GeForce RTX 3070 GAMER OC成绩全部领先RTX 2080Ti,如果说在DX11环境下领先不多,在DX12环境下新架构的优势就凸显出来了。
影驰 GeForce RTX 3070 GAMER OC相比RTX 2070的TS分数高58%,TSE中分数高67%。而相比公版RTX 3070的领先幅度为4%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,影驰 GeForce RTX 3070 GAMER OC的测试结果仍然要优于RTX 2080 Ti 6%左右;相比RTX 2070提升58%;而对比公版的提升为3%。
在理论测试中,影驰 GeForce RTX 3070 GAMER OC的大部分成绩均优于RTX 2080 Ti,仅在DX11环境下的FireStrike的成绩中被RTX 2080 Ti领先。
下面进行游戏测试环节。不过遗憾的是我们手头没有公版RTX 2080 Ti,无法进行对比测试。上面理论测试的环节成绩也是使用之前的测试成绩进行对比。
04 游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件进行测试。
《古墓丽影:暗影》游戏测试
在《古墓丽影:暗影》中,由于加入了光追和DLSS效果,所以我们分为2组6测,为了照顾以前没有DLSS时的测试分数,第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。
其中影驰 GeForce RTX 3070 GAMER OC对比RTX 2070在1080P分辨率下,提升41%和44%;2K分辨率下提升48%和46%;4K分辨率下提升57%和57%,整体提升幅度在40-50%之间,而且在4K分辨率下的提升尤为明显;而相比公版RTX 3070的提升幅度在5-10%左右。
《德军总部新血脉》游戏测试
在《德军总部新血脉》中,由于自带两个benchmark,所以我们的数据取跑分均值,另外游戏跑分中默认不开启DLSS,我们手动将DLSS选项调整为平衡。其中影驰 GeForce RTX 3070 GAMER OC对比RTX 2070在1080P分辨率下的分数高28%,2K分辨率下高52%;4K分辨率下高67%。
《刺客信条:奥德赛》游戏测试
接下来是《刺客信条:奥德赛》,这款游戏因吃配置而闻名,被玩家戏称为众生平等,在测试中影驰 GeForce RTX 3070 GAMER OC频率的提高影响并不是很大,相比RTX 2070在1080P分辨率下分数提升28%;2K分辨率下提升35%;4K分辨率下提升43%。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,影驰 GeForce RTX 3070 GAMER OC比RTX 2070在1080P分辨率下分数提升24%;2K分辨率下提升41%;4K分辨率下提升53%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载,看看自己的显卡处在什么水平线上。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
在1080P分辨率下,影驰 GeForce RTX 3070 GAMER OC比RTX 2070分数高78%,2K分辨率下高79%,4K分辨率下高92%。
《边境》游戏测试
《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。
在1080P分辨率下,影驰 GeForce RTX 3070 GAMER OC比RTX 2070分数高61%,2K分辨率下高64%,4K分辨率下高69%。
通过游戏的帧数对比不难发现越新发布的采用DX12环境的游戏帧数提升越大,其中以《光明记忆:无限》和《边境》为最,这两款跑分软件的场景演示新增了很多新的光追效果。
如焦散、折射、反射、阴影和环境光遮蔽等更复杂的光线追踪,这对于Turing架构下的第一代RT Core负担非常大,而全新的NVIDIA Ampere下的第二代RT Core可以达到39.7 RT TFLOPS,相比Turing的23.8 RT TFLOPS,运算能力提升了66%,最终的测试结果成绩显著。
05 温度与功耗测试
在温度功耗测试方面,室温24℃,功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。
功耗及温度测试
相比旗舰级的RTX 3080,影驰 GeForce RTX 3070 GAMER OC的功耗要小得多,在峰值情况下整体平均240W左右。
温度统计
温度方面,影驰 GeForce RTX 3070 GAMER OC经过10分钟的拷机,依然控制在66℃左右,散热效果非常出色,另外这款显卡在尺寸上控制在337×135×53mm,除了长度之外,显卡的宽度和厚度在30系显卡家族中,绝对算得上迷你了,而且这款显卡的Boost频率为1800 MHz,热量将会比公版更大,但是散热效率正如数据显示,非常强大。
06 软件与硬件辅助发力
在很多玩家的印象中,显卡是否强大完全取决于硬件配置,但如果没有软件的辅助和加持,性能会大打折扣,甚至发挥不出应有的水平。此次此次随着发布会共同推出的还有以下几项技术非常值得大家关注。
NVIDIA Reflex
系统延迟这个词在以往会被很多人忽略,以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从点击鼠标到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标以及驱动程序中的软件支持。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,目前已经在NVIDIA官网发布,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
和小动物们一起决斗吧!
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来,所以如果你想体验上面的欢乐直播,一张GeForce RTX显卡是必须的。
x264编码
同时在直播中用户还会面临另一项问题,大部分玩家直播往往只有一台电脑,采集卡根本无用武之地,但在直播过程中会极大占用CPU,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而RTX 30系显卡拥有目前最好的硬件解码器,基于GPU的NVENC解码可以极大地减轻CPU负担。
NVENC编码
在相同场景下使用x264编码,CPU的占用率为13.7%,使用硬解NVENC编码,CPU的占用率为1.6%,两种解码方式对CPU的占用率相差12%所有,不过我们的测试平台所使用的CPU为i9-10900k,目前的桌面旗舰级CPU,性能也是顶尖的,仅具有部分参考价值。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键,使用GPU渲染能够使效率快上几倍甚至几十倍。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
CPU渲染时间为11:34分钟
GPU渲染时间为14.98秒
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现,例如在Keyshot专业渲染软件中,不管是RTX 30系哪一个型号的显卡,都要比CPU渲染快数十倍的速度。NVIDIA Studio不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
07 魔盘 XTAEME TUNER
如果用户购买影驰GeForce RTX 3070 GAMER OC显卡,还可以从官网下载魔盘 XTAEME TUNER软件,这款软件经过不断更新迭代后,功能强大且界面简洁明了,即便入门玩家也能轻松操作。
魔盘 XTAEME TUNER软件首页会显示显卡的基本信息,我们使用的是影驰GeForce RTX 3070 GAMER OC显卡,可以看到型号、显卡驱动版本、频率、温度、风扇转速、显存等信息一应俱全。
第二页为超频页面,可以手动增加电压、频率等参数。不过新手不建议手动超频,容易导致显卡故障,而且对于此类人为故障是无法保修的。
在灯光调节页面中,效果简单明了,可以手动调节灯光的颜色、模式以及亮度等参数。另外在面板中的【MBsync】是与主板同步灯光按钮,亮起状态下是无法单独调节显卡的,需要关闭主板同步。
最后一页为风扇调节页面,在这里可以手动调节风扇转速,默认状态下为【自动】,也就是显卡预设的模式,在温度较低的情况下显卡风扇为了节能和降低噪音是不转的,只有运行程序也就是温度上升后才会启动。当然如果显卡温度过高,可以在这里手动将风扇转速调节至100%,但相对的噪音会比较大。
08 拼出个性 拼出定制
RTX 3070非公版的显卡已经于10月29日开始售卖,虽然此前有消息说供货量将会很大,不过以目前的电商情况来看,依然是有价无市。不过这也不难理解,RTX 3070显卡的推出可以说彻底让20系显卡成为了过去时,超过RTX 2080 Ti的性能加上和上一代相仿的售价,着实的有诱惑力。
影驰 GeForce RTX 3070 GAMER OC
影驰此次推出的GAMER系列大大颠覆了用户对于显卡外观设计的想象,当厂商都在为外观设计而发愁的时候,影驰的GAMER系列把选择权交给了用户自己,只要你有足够的想象力,就能DIY出属于自己的显卡外观。而且不管你是传统的横装还是竖装显卡,导流罩 背板部分的插槽都能满足DIY的需求。
DIY后的影驰 GeForce RTX 3070 GAMER OC
从显卡规格来讲,影驰 GeForce RTX 3070 GAMER OC的频率为1800MHz,相比公版的1725MHz更高,同时温度却比公版更低,拷机10分钟66℃足以证明这款显卡散热的强大。TGP 240W的功耗推荐电源为650W,这就可以让部分用户在升级显卡时直接升级而无需更换电源。
影驰 GeForce RTX 3070 GAMER OC可拆卸亚克力罩
在游戏表现上,现阶段大部分3A游戏4K分辨率下都能达到流畅运行标准,而目前主流玩家的显示器分辨率依然是1080P或者2K,所以RTX 3070级别的显卡性能完全能够满足大部分玩家。
另外前文我们也提到,随着RTX 3070显卡发布的还有众多软件和技术,NVIDIA Broadcast、NVIDIA Studio等软件加上第二代RT Core,第三代Tensor Core能为显卡带来强的光线追踪与AI学习能力,在专业的创作软件中也有着更明显的优势。
影驰 GeForce RTX 3070 GAMER OC背板
总的来说,影驰 GeForce RTX 3070 GAMER OC显卡有着高频和可DIY的特点,尤其这次创新的在显卡导流罩部分采用了乐高基座设计,把外观定制化的部分交给玩家自己,只要你有想法有创意,就能DIY出属于自己独一无二的显卡。在游戏方面,这款的性能也让玩家可以充分调节游戏特效,4K流畅依然不是问题。而高性能低功耗的特点,也让大部分玩家可以直接升级显卡无需担心电源问题。