继 RTX4090 之后,各大 AIC 厂商又开始相继推出适用人群更广的 RTX4080 显卡,相比公版显卡,它们往往在 ID 设计和性能堆料上更加个性和极致。最近,IT之家拿到了影驰首发的 RTX4080 16GB 星曜 OC 显卡,作为白色系的代表卡,星曜系列的颜值一直在线,那么这次它的表现又如何呢?
为了能够更好反映它的性能水准,IT之家将采用以下配置进行测试:
外观 ID 设计
和公版 RTX4080 有所不同,影驰 RTX4080 16GB 星曜 OC 虽然改为了三槽设计,但还是有略微越肩,不过厚度比 RTX4090 还是要薄一些的。在设计语言上,影驰 RTX4080 16GB 星曜 OC 整体造型更加方正,线条也更加硬朗,仅在四角做了斜向切边设计增强轮廓感。
影驰 RTX4080 16GB 星曜 OC 显卡的 TGP 功耗为 320W,包装中所附带的转接线改为了 3 个 8 Pin 转 16 Pin 的转接线,考虑到显卡的体积和重量,影驰还是为其配备了一个 ARGB 显卡支撑杆套件,同样为纯白涂装,亚克力外壳表面不仅有 2 个 BOOMSTAR Logo,还做了不规则的晶体造型装饰。
影驰 RTX4080 16GB 星曜 OC 显卡的正面保留了黑白撞色的家族设计语言,纯白涂装的金属装甲,套上一层带有钻石切割设计透明外壳,不仅更有层次感,观感也像水晶一般,而且这个上盖是可拆卸的,支持个性 DIY,每个玩家都能定制属于自己的独有外观。
背板部分,影驰 RTX4080 16GB 星曜 OC 采用一体压铸成型工艺,镂空部分既带来了极具辨识度的星曜装饰图案,又确保了散热性能,白色的喷涂处理搭配丝印工艺进一步提升了产品的质感。3 个直径 102mm、厚度 20mm 的高规格风扇,每个风扇拥有 11 片静霜扇叶,风力更强风量更大。
影驰 RTX4080 16GB 星曜 OC 的显卡侧面的裸露部分可以看到体积巨大的散热格栅,内置的星卓 III 散热系统拥有 4*Φ8mm+5*Φ6mm 镀镍复合热管、大面积高效能均热板和鳍片,结合回流焊接工艺,带来更强的散热性能,合金加强件也能有效防止显卡变形,保障显卡的正常使用。
同时,影驰 RTX4080 16GB 星曜 OC 侧面部分也进行了半包裹设计,背板延伸出来的部分印着黑色的 GEFORCE RTX 标志。
金属 I / O 挡板部分提供了标准的 3*DP1.4a 接口 + 1*HDMI2.1 接口,最高可支持 8K 分辨率的显示器。
值得一提的是,影驰 RTX4080 16GB 星曜 OC 装机后的效果非常不错。正面的 logo 会亮起 RGB 灯效,侧边也有环绕的一圈 RGB 效果。
风扇面的灯效更加漂亮,由于影驰 RTX4080 16GB 星曜 OC 的磨砂半透明风扇设计,风扇 RGB 灯光会更加柔和,不刺眼但亮度很足,色彩过渡也更加自然,配合纯白色卡身,给人一种非常高级的感觉。
简单技术解析
影驰 RTX4080 16GB 星曜 OC 基于全新一代 NVIDIA Ada Lovelace 架构 AD103 核心打造,采用了 TSMC 4N 工艺,9728 个 CUDA 核心、304 个 Tensor 核心、112 个 ROP 单元。相对于公版 RTX4080,这张卡还采用了 18+3 相豪华供电和 12 层高规格 PCB,超越公版配置同时电气性能更好。
影驰 RTX4080 16GB 星曜 OC 的显存提升到了 16GB GDDR6X 类型,显存位宽 256-bit,大显存最大的好处就是不再担心游戏中的爆显存问题,对生产力创作更加优化,而且显卡核心频率 2205MHz,加速频率 2580MHz,显存频率高达 22.4Gbps,提升非常恐怖。
第三代 RTX Cores 得益于 Ada 全新旗舰架构,光追性能最高可提升至 2 倍,NVIDIA DLSS 3 也进行了全面进化,相比 DLSS 2 增加了帧生成技术,能够预测帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时实现更高的帧率。这些技术自然是利好于游戏玩家的,RTX4080 在次世代游戏中的表现令人期待。
RTX4080 拥有高达 83TFLOPS 的着色器能力,吞吐量超过上一代产品 2 倍。第四代 Tensor Cores 可将吞吐量提升 4 倍,达到 1.4Tensor-petaFLOPS,AI 性能提升至 2 倍。双 NVIDIA 编码器还支持了 AV1 编码,效率比 H.264 高 40%,广大游戏主播,视频通话和视频创意工作者都能享受到它所带来的画质提升和效率提升。
而能效比方面,通过 TSMC4N 定制工艺,可实现高达 2 倍的功耗比提升,影驰 RTX4080 16GB 星曜 OC 的预设功耗为 320W,和 RTX 3080 10G 版保持一致,但是考虑到性能的巨大提升,能效比的优势将会更加突出。
理论性能测试
说完技术部分,就轮到真刀真枪的实测了。首先我们进行烤机测试,单烤 15 分钟甜甜圈,核心温度稳定在了 61.6℃,比相同测试平台的公版 GTX4080 还要低 3℃,功耗保持在满血 320W,风扇转速仅为 38%,因此机器运行时非常安静。
在 3D Mark 压力测试中,影驰 RTX4080 16GB 星曜 OC 显卡的最终得分为 99.6%,性能释放稳定,轻松通过 97% 的合格率。
3D Mark 单项测试部分,首先在反映 DX12 游戏性能的 Time Spy 测试中,影驰 RTX4080 16GB 星曜 OC 显卡分数达到了 26622 分,作为对比,相同测试平台的公版 RTX4080 分数为 26552 分,GeForce RTX 3080 10G 版的分数为 17306 分,RTX 3090 的分数为 18981 分,RTX 3090Ti 为 21862 分。影驰 RTX4080 16GB 星曜 OC 显卡全面领先 RTX30 系,也略微超越了公版 RTX4080。
在反映 DX11 游戏性能的 FireStrike 测试中,影驰 RTX4080 16GB 星曜 OC 的显卡分数达到了 55001 分,作为对比,相同测试平台的公版 RTX4080 分数为 53379 分,GeForce RTX 3080 10G 版的分数为 40932 分,GeForce RTX 3090 的分数为 46045 分,GeForce RTX 3090Ti 为 52630 分,4K 分辨率畅玩 3A 游戏已经不是问题。
在 3DMark Portal Royal 光追测试中,影驰 RTX4080 16GB 星曜 OC 获得了 17264 分,比 GeForce RTX 3080 提升了大约 50%,提升幅度比光栅性能来得更大。
影驰 RTX4080 16GB 星曜 OC 显卡在理论跑分中的成绩绝对称得上是震撼,我们制作了一份 GPU 物理分数的对比表,在所有项目中相比于前代几张旗舰显卡都有着明显的提升。
NVIDIA DLSS 3 解析
虽然理论性能已经超越了所有的 RTX 30 系显卡,但真正重磅的提升还要属 DLSS 3 技术。DLSS 3 是一款由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,以 AI 技术为核心的性能倍增技术,是 NVIDIA 深度学习超级采样技术的最新版本,并拥有开创性的光学帧生成技术,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
那么我们同样通过实测看看新卡的表现吧。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把影驰 RTX4080 16GB 星曜 OC 的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。
经过IT之家的实测,在 DLSS 2 模式下,影驰 RTX4080 16GB 星曜 OC 的平均帧数为 98.51 帧,这个成绩粗略估算下相比于不开 DLSS 2 提升了 2.5 倍。
而开启了最新的 DLSS 3 之后,影驰 RTX4080 16GB 星曜 OC 的平均帧数进一步提升到了 126.92 帧,粗略估算下相比于不开 DLSS 2 提升了 3.3 倍。
当然,新技术最大的问题在于能否快速适配新游戏,显然 NVIDIA 在这方面做得很不错,不仅首批 DLSS 3 的游戏阵容非常豪华,而且只要适配了 DLSS 3,就能向下兼容 DLSS 2,这将大幅减小开发者的适配难度,玩家也能最大化的获益。本次我们选取了《赛博朋克 2077》《超级人类》《光明记忆:无限》和《生死轮回》等多款已经适配了 DLSS 3 的游戏来对影驰 RTX4080 16GB 星曜 OC 进行测试。
首先,在《绝地求生》开发商蓝洞的新作《超级人类》中,DLSS 各项档位的帧数有明显区分,在开启 DLSS 3 性能档后帧数相比不开 DLSS 提高了 60%,直接从 4K 流畅运行,变成 4K 高帧畅玩。
在非常考验 GPU 性能的《赛博朋克:2077》中,我们在 4K 超级光追的最高画质下进行自带 BenchMark 测试,从结果来看它对 GPU 性能的压力确实不小,DLSS 全关时的帧数只有 75,而打开 DLSS 3 并选择性能档后,帧数提升到 93 帧,增幅达到了 24%。
在国产游戏《生死轮回》中,DLSS 3 性能档位比起不开 DLSS 时,也能为其带来 55% 左右的帧数提升。那么如果你手里有 8K 显示设备,也可以用挑战试试。
《生死轮回》这款游戏非常注重光追效果的表现,图中打开和关闭 DLSS 3 时,地面水坑的投影有明显区别,开了 DLSS 3 基本完美倒映了街边的建筑,而没开 DLSS 时则只有人物的投影。
除了《生死轮回》,《光明记忆:无限》也是一款光追表现力很强的游戏,在 DLSS 3 的实际测试中,开启 DLSS 3 性能档后,帧数提升同样十分明显,增幅高达 108%。
在近期比较火而且画质非常出色的 3A 游戏《瘟疫传说:安魂曲》中,开启 DLSS 3 之后的性能提升高达 3 倍,对于材质和贴图比较复杂的游戏,DLSS 3 能够发挥巨大的优势。
游戏延迟测试
当然,DLSS 3 技术的本质是 AI 生成全新帧,那么必定会带来延迟增加这个副作用,对于操作精度要求很高的游戏来说,ms 级的延迟差异,也会影响玩家的体验和手感。所以在打开 DLSS 3 的帧生成功能之后,NVIDIA Reflex 也会被强制打开,尽量缩短生成帧带来的渲染延迟。
我们以上面的《瘟疫传说:安魂曲》为例,在打开 DLSS 3 并开启 Reflex 之后,延迟降低了 6ms。
除了支持 DLSS 3 的游戏外,IT之家也测了一些 FPS 竞技端游和仅支持 DLSS 2 游戏的性能表现。例如在《守望先锋:归来》这款游戏中,提供了 NVIDIA Reflex 低延迟选项,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,响应时间也就更快。经过实测,在开启了增强 Reflex 选项后,延迟降低了一半。
在图形优化非常不错《古墓丽影: 暗影》中,实测在 4K 分辨率最高画质下运行游戏自带的 BenchMark,能跑到 137 帧,已经能基本满足 4K / 144Hz 的显示器畅玩了。
《古墓丽影: 暗影》支持 DLSS 2,开启之后帧数可以提升最多 79%。
最后,在比较吃显卡性能的老游戏《控制:终极版》中,DLSS 2 带来的游戏帧数增幅也高达一倍,不开 DLSS 时 4K 光追是无法跑到 60 帧的,但是开启之后,基本可以达到电竞水平了。经过一番测试,影驰 RTX4080 16GB 星曜 OC 驾驭 4K 游戏已经没有任何问题了,对于游戏玩家来说,它绝对是一块趁手的游戏工具。
创意生产测试
我提取了此次 RTX40 系显卡在专业创意生产方面的关键词,它们是大显存、高吞吐、新解码、强 AI。借助这些技术层面的升级,RTX4080 显卡一定能在创意生产和深度学习方面带来更高效率和更大潜力。通过安装 NVIDIA Studio 驱动,来支持超过 75 款创意软件调用 NVIDIA CUDA 核心的 AI 算力。
在建模渲染类软件中,GeForce RTX 4080 16G 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
在 V-Ray Benchmark 中,影驰 RTX4080 16GB 星曜 OC 获得了 3081 分,可以应对大部分的建模渲染需求。
得益于 Ada 全新旗舰架构,光追性能获得大幅提升,影驰 RTX4080 16GB 星曜 OC 在 V-Ray GPU RTX 中的分数提升至 4208 分,即使是实时光追的高渲染压力也能从容应对。
另一款渲染软件 Octane 中,我们可以测试 RTX 加速的光线追踪和搭载 AI 的 OptiX 降噪可实现快速的交互式渲染综合性能,软件为我们提供了一个不错的基准项,一个性能基准为一块 GTX980。影驰 RTX4080 16GB 星曜 OC 在该测试中,不同子项的性能大致相当于 4.5-20 个 GTX980,提升非常明显。
还有就是双 NVIDIA 编码器支持了 AV1 编码。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。这个编码格式在目前的主流多媒体应用中已经非常普遍了,比如国内的剪辑软件剪映专业版就已经支持了 AV1 的视频编码器加速,还有 OBS 直播软件,目前也支持了 NVENC 的 AV1 编码的录制。
AV1 成为趋势既是科技进步的结果,也戳中了行业对于生产力需求的痛点,那就是大幅压缩视频文件的体积大小,同时保证画质几乎不受影响。
我们对此也进行了一项简单的测试,通过剪辑专业版软件采用 H264 和 AV1 这两种不同的编码导出同一段视频素材。最终 H264 编码的文件大小为 19.3MB,而 AV1 编码的文件大小只有 13.3MB,体积缩小了 32%,但是画质基本看不出区别。
最后是 PugetBench For Davinci 的渲染测试。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。影驰 RTX4080 16GB 星曜 OC 在该测试中得到了 2620 分的成绩,8K 视频剪辑再不用开代理了。
总结
显卡和 CPU 这样的高精尖产品,一直受困于物理定律,人们往往会担心在制程和工艺上达到物理极限后将会出现的性能停滞。但是,NVIDIA 却通过 AI 技术,机器学习等方面的攻坚,硬生生在物理定律面前撕开了另一个出口,这就是我测完影驰 RTX4080 16GB 星曜 OC 之后最大的感触。
无论是实时光线追踪、DLSS 还是插帧,单从软件和技术层面,就能做到每一代性能的大幅提升,游戏帧数的成倍增加,以及渲染效率的颠覆,对普通玩家来说是震撼,对行业和开发者而言则是振奋。充分利用 RTX 40 系 GPU 的非凡 AI 算力,相信会为次世代提供无限可能和机遇。
对于玩家和创意设计相关人员来说,影驰 RTX4080 16GB 星曜 OC 并不只是一张单纯的图形性能输出工具,它拥有显卡品类中独具个性的前卫设计,稀有的纯白风格涂装,在 DIY 装机和桌搭上都能给你带来高颜值和高级美感,而性能上相信看完评测的各位都能体会到它的强大,特别是 4K 高帧游戏和 8K 视频渲染等。总之,入手影驰 RTX4080 16GB 星曜 OC 能够让你的游戏和办公体验一步到位。