英伟达在其 RTX 30 系列和 RTX 40 系列显卡上有两个突出的功能:光线追踪和 DLSS。 PlayStation 5 和 Xbox Series X 在向大多数人介绍光线追踪方面都做得很好,但 DLSS 仍然有点模糊。 这有点复杂,但它可以让您以虚拟化的更高分辨率玩游戏,保持更多的细节和更高的帧速率,而不会对您的显卡造成太大的负担。 它通过利用机器学习的力量为您提供世界上最好的东西,并且随着 DLSS 3 的引入,该技术变得更加强大。
但故事远不止这些。 以下是您需要了解的有关 DLSS、它的工作原理以及它可以为您的 PC 游戏做什么的所有信息。
什么是 DLSS?
DLSS 代表深度学习超级采样。 “超级采样”位是指一种抗锯齿方法,它可以平滑呈现在渲染图形上的锯齿状边缘。 然而,与其他形式的抗锯齿相比,SSAA(超级采样抗锯齿)通过以更高的分辨率渲染图像并使用该数据以原始分辨率填补空白。
“深度学习”部分是英伟达的秘诀。 利用机器学习的力量,英伟达可以训练具有高分辨率扫描的 AI 模型。 然后,抗锯齿方法可以使用 AI 模型来填充缺失的信息。 这很重要,因为 SSAA 通常要求您在本地渲染更高分辨率的图像。 Nvidia 离线进行,远离您的计算机,提供超级采样的好处而没有计算开销。
这一切都归功于英伟达的 Tensor 内核,这些内核仅在 RTX GPU 中可用(在数据中心解决方案之外,例如 Nvidia A100)。 尽管 RTX 20 系列 GPU 内部具有 Tensor 核心,但 RTX 3060、3060 Ti、3070、3080 和 3090 配备了 Nvidia 的第二代 Tensor 核心,可提供更高的每核心性能。
英伟达最新的 RTX 40 系列显卡将 Tensor 内核提升到了第四代。 这使得 DLSS 增强功能更加强大。 得益于新的 8 位浮点张量引擎,内核的吞吐量比上一代提高了 5 倍。
英伟达在这一领域处于领先地位,尽管 AMD 的新 FidelityFX 超分辨率功能可能会带来一些激烈的竞争。 甚至英特尔也将很快发布自己的超级采样技术,称为 Intel XeSS,或 Intel Xe Super Sampling。 稍后再谈。
DLSS 究竟做了什么?
DLSS 是教 Nvidia 的 AI 算法生成更好看的游戏的详尽过程的结果。 在以较低分辨率渲染游戏后,DLSS 从其超分辨率图像训练的知识库中推断信息,以生成看起来仍像以更高分辨率运行的图像。 这个想法是让以 1440p 渲染的游戏看起来像是在运行 4K 或 1080p 游戏,看起来像 1440p。 DLSS 2.0 提供四倍的分辨率,允许您以 1080p 渲染游戏,同时以 4K 输出游戏。
更传统的超分辨率技术可能会导致最终图片中出现伪影和错误,但 DLSS 旨在处理这些错误以生成更好看的图像。在适当的情况下,它可以在不影响游戏外观和感觉的情况下显着提升性能;相反,它可以让游戏看起来更好。
早期的 DLSS 游戏(如《最终幻想 XV》)提供了适度的帧速率提升,从每秒 5 帧到 15 fps,而最近的版本则有了更大的改进。在《Deliver us the Moon》和《Wolfenstein: Youngblood》等游戏中,英伟达为 DLSS 引入了一种新的 AI 引擎,我们被告知它可以提高图像质量,尤其是在 1080p 等较低分辨率下,并且在某些情况下可以将帧速率提高 50% 以上。
使用最新的 DLSS 3 迭代,帧速率增益可能会更加显着。 英伟达展示了 Microsoft Flight Simulator 的视频,其中帧速率得到了大幅提升,从没有 DLSS 的 64 fps 到使用 DLSS 3 的 135 fps。
DLSS 用户还可以进行新的质量调整模式,在性能、平衡和质量之间进行选择,每种模式都将 RTX GPU 的 Tensor 核心马力集中在 DLSS 的不同方面。
DLSS 是如何工作的?
DLSS 强制游戏以较低的分辨率(通常为 1440p)渲染,然后使用其训练有素的 AI 算法来推断如果以更高的分辨率(通常为 4K)渲染它会是什么样子。它通过利用一些抗锯齿效果(可能是 Nvidia 自己的 TAA)和一些自动锐化来做到这一点。在更高分辨率下不会出现的视觉伪影也被消除,甚至用于推断图像中应该出现的细节。
AI 算法经过训练可以以极高的分辨率(假设为 64 倍超级采样)查看某些游戏,并且在添加到最新的 Nvidia 驱动程序版本之前被提炼到只有几兆字节的大小,并可供所有游戏玩家使用全世界。最初,Nvidia 必须逐个游戏地完成这个过程。在 DLSS 2.0 中,Nvidia 提供了一个通用的解决方案,因此不再需要为每个游戏训练 AI 模型。
实际上,DLSS 是 Nvidia 的屏幕截图增强 Ansel 技术的实时版本。它以较低的分辨率渲染图像以提供性能提升,然后应用各种效果以提供与提高分辨率相对应的整体效果。
结果可能是喜忧参半,但总的来说,它会导致更高的帧速率,而不会显着损失视觉保真度。 Nvidia 声称,当同时使用 DLSS 和光线追踪时,Remedy Entertainment 的 Control 中的帧速率可以提高多达 75%。它通常没有那么明显,并不是每个人都喜欢 DLSS 游戏的最终外观,但对于那些想要美化他们的游戏而无需以更高的分辨率运行成本的人来说,这个选项肯定是存在的。
随着时间的推移更好
DLSS 有可能让在 1080p 以上的分辨率下无法达到舒适帧速率的游戏玩家能够通过推理来做到这一点。 DLSS 无疑是 RTX GPU 最强大的功能之一。它们并不像我们希望的那样强大,光线追踪效果很漂亮,但往往会对性能产生相当大的影响,但 DLSS 为我们提供了两全其美的效果:外观更好、性能也更好的游戏。
最初,DLSS 似乎是低端显卡的小众功能,但事实并非如此。相反,DLSS 使《赛博朋克 2077》和《控制》等游戏能够在高端硬件上提升视觉保真度,而不会使游戏无法玩。 DLSS 提升了低端硬件,同时为高端硬件提供了未来的一瞥。
Nvidia 展示了 RTX 3090 渲染游戏,例如 Wolfenstein:YoungBlood 8K,开启了光线追踪和 DLSS。尽管距离广泛采用 8K 还很遥远,但 4K 显示器正变得越来越普遍。游戏玩家可以以 1080p 或 1440p 渲染并使用 DLSS 填充缺失的信息,而不是以原生 4K 渲染并希望保持在 50 fps 到 60 fps 左右。结果是更高的帧速率,而图像质量没有明显损失。
DLSS 也一直在改进,它会定期接收更新以尝试改进 AI 算法。它现在允许它更智能地使用运动矢量,这基本上有助于改善物体在移动时的外观。此更新还减少了重影,使粒子效果看起来更清晰,并提高了时间稳定性。 DLSS 2 现在已被广泛采用,截至 2022 年 9 月,已有 216 款游戏支持它。
不过,改进并不止于此。事实上,随着 DLSS 3 的引入,事情将变得更加有趣。
DLSS 3 通过渲染帧而不是像素来重塑技术
9 月 20 日,在 GTC 2022 主题演讲中,Nvidia 宣布了 DLSS 3(该技术的最新版本),将提供给 RTX 40 系列显卡的所有者。与之前的一些较小的更新不同,这次对 DLSS 的更改很大,并且它们有可能提供巨大的性能提升。
这一次,DLSS 将能够预测实际帧,而不仅仅是像素,填充您的 GPU 未渲染的内容,并在许多游戏中提供帧速率提升。据 Nvidia 称,DLSS 3 的速度将是 DLSS 2 的四倍,并且能够提高大多数游戏的性能,包括主要依赖 CPU 而不是 GPU 的游戏。
英伟达正在全力升级这一代超级采样技术。新的光流加速器帮助 DLSS 预测会发生什么并填补空白。该公司还推出了 Nvidia Reflex,这是一种同步 GPU 和 CPU 的功能,可将延迟减少多达两倍。
如上所述,Nvidia 在 Microsoft Flight Simulator 中展示了 DLSS 3,在这类游戏中达到 135 fps,高于 64,简直是巨大的。 《赛博朋克 2077》中的收益同样显着。
总而言之,Nvidia 的首席执行官 Jensen Huang 承诺 DLSS 3 的性能将是 DLSS 2 的四倍。不过,我们必须等待技术问世才能自己进行测试,但这不会至少要到 10 月 12 日。
DLSS 与 FSR 与 RSR 与 XeSS
在图形技术方面,AMD 是 Nvidia 最大的竞争对手。 为了与 DLSS 竞争,AMD 在 2021 年发布了 FidelityFX 超分辨率(FSR)。虽然它实现了在提高帧率的同时改善视觉效果的相同目标,但 FSR 的工作方式与 DLSS 截然不同。 FSR 以较低的分辨率渲染帧,然后使用开源空间放大算法使游戏看起来像是在以更高的分辨率运行,并且不考虑运动矢量数据。 DLSS 使用 AI 算法来提供相同的结果,但这种技术仅受 Nvidia 自己的 RTX GPU 支持。 另一方面,FSR 几乎可以在任何 GPU 上运行。
除了 FSR,AMD 还拥有 Radeon 超分辨率 (RSR),这是一种利用 AI 的空间升级技术。虽然这听起来与 DLSS 相似,但还是有区别的。 RSR 使用与 FidelityFX 超分辨率 (FSR) 相同的算法构建,是一种基于驱动程序的功能,通过 AMD 的 Adrenalin 软件提供。 RSR 旨在填补 FSR 不可用的空白,因为后者必须直接实施到特定游戏中。从本质上讲,RSR 应该适用于几乎所有游戏,因为它不需要开发人员来实现它。值得注意的是,FSR 适用于较新的 Nvidia 和 AMD GPU,而 RSR 仅与 AMD 的 RDNA 卡兼容,其中包括 Radeon RX 5000 和 RX 6000 系列。很快,该阵容将扩展到包括 RDNA 3 及其 Radeon RX 7000 系列 GPU。
英特尔还一直致力于开发自己的超级采样技术,称为英特尔 XeSS,或英特尔 Xe 超级采样。这种图像放大技术同时使用空间和时间数据,即图像数据和运动数据,并利用人工智能进一步提高图像质量。它通过训练有素的神经网络传递数据,利用机器学习和人工智能来提高图像质量,这类似于 DLSS。
英特尔正在开发两个版本的 XeSS。第一个使用 XMX 矩阵数学单元,该单元将出现在其新的 Xe-HPG GPU 中,以处理硬件端的所有 AI 处理。另一个版本将使用广泛接受的四元素向量点积 (DP4a) 指令,从而消除对英特尔自身硬件的依赖。据英特尔称,英特尔 XeSS 可将性能提升两倍,而硬件速度较慢、分辨率限制为 1080p 和低设置的系统将能够以 4K 运行游戏。英特尔还计划开源 XeSS SDK 和工具。
https://www.nvidia.cn/geforce/technologies/dlss/