凭借 AI 人工智能, 这家显卡公司的股价在过去的三年飙涨至少 10 倍, 并在 2018 年 10 月创下股价历史最高点 -- 每股 289.36 美元, 市值一度超过 IBM 和麦当劳.
然而高潮过后, 滑铁卢式的股价大跌让 NVIDIA 不得不面对现实, 显卡始终是其主要收入来源, AI 也并不能让其摆脱 "显卡公司" 的标签.
随着 AI, 挖矿, 数字货币热潮的褪去, NVIDIA 也 "冷静" 下来, AI 是未来, 这固然重要, 但是显卡在 NVIDIA"心" 中的地位依旧不可撼动, 全球第一显卡厂商 NVIDIA 开启了显卡在游戏领域的新一轮布局.
老黄的未来 光线追踪技术深度解析
2018 年 8 月, 新一代 Turing 图灵架构显卡在德国科隆游戏展前首次亮相, 老黄 (NVIDIA 创始人兼 CEO 黄仁勋) 手中拿起了他的全新 "核弹"--RTX 2080Ti.
图灵架构桌面级显卡全家福
随后的日子里, NVIDIA 陆续推出了搭载图灵架构的 RTX 2080/2080Ti,RTX 2070,RTX 2060,GTX 1660/1660Ti,GTX 1650 桌面级显卡, 以及 RTX 2080,RTX 2070,RTX 2060,GTX 1660Ti,GTX 1650 移动端显卡.
提起新一代图灵架构显卡, 就不得不提老黄的 "光追大计". 自首次提出后,"光线追踪" 便成为了显卡和游戏行业的高频词汇,"光追是未来" 似乎已经成为了一个肯定的结论.
什么是光线追踪? 目前网上对于它的相关解释已经非常多了, 从实际游戏角度来说光线追踪是一种能够有效改善 / 提升游戏画面品质的技术, 能够为游戏玩家提供更加真实的光影效果, 沉浸感更强, 其直观效果有点类似 HDR 技术 , 而光线追踪与 HDR 的结合也将成为未来游戏硬件的最优解决方案之一.
为了让现阶段用户更好享受光线追踪带来的游戏增益, NVIDIA 同时推出了两项核心技术 RT Core 和 DLSS,RT Core 简单来说是 NVIDIA 专为光线追踪打造的一个处理核心, 其可以让游戏画面发生质的改变, 但对硬件性能要求很高; 而 DLSS 是在硬件性能无法达到要求时提供的 AI 算法优化, 通过 Tensor Core(张量计算核心, 针对 AI 深度学习)提升游戏性能, 二者互补.
RT Core: 专为光线追踪计算服务
NVIDIA 方面表示, 此前不支持光线追踪时, 显卡是不需要提供与光线追踪相关的 BVH(Bounding Volume Hierarchy)算法的, 因此以前光线追踪方面相关的算法都是通过 CUDA 核心来实现的; 而如今, 光线追踪的加持会让这部分算法量级显著增加, 成为显卡核心中的重点之一, NVIDIA 为此专门设计了 RT CORE 来完成这项工作.
在游戏的 3D 世界中, 每一个物体都是由三角形组成的(3D 世界中, 三角形是最基本的图形),RT Core 要去计算光线和三角形的交汇点, 并判断光线如何反射. 同时, 在自然界中光线数量是无数条的, 而计算机不可能完全模拟现实世界的光影, 但它却会尽可能模拟更多的光线, 只有当光线数量足够多的时候, 最后输出的游戏画面才会越平滑, 噪点也会越少. 此外, 这其中还会融入很多 AI 降噪技术以实现更接近现实世界的光影.
每个游戏光线追踪的应用效果都不同
值得一提的是, 光线追踪在不同游戏中的应用效果是不一样的,"我们现在其实是一个混合渲染",NVIDIA 方面强调,"有部分场景应用了光线追踪反射(高级反射和普通反射, 其中高级反射会反射很多次, 需要更大的计算力), 阴影的效果, 但是有些地方还是用以前传统的光栅化方式, 拥有很多不同的模式. 我们追求的是画面显示效果和最终性能的平衡, 在不同游戏中游戏开发商也可以选择加入不同光线追踪的效果, 每一个游戏都不太一样."
不同光线追踪效果的应用往往影响游戏对于显卡性能的要求, 目前 NVIDIA 提供的主要光线追踪效果包括全局光照, 反射, 阴影, 环境光遮蔽等, 其中全局光照能够把整个游戏场景渲染得更逼真, 也是对显卡性能要求是最高的光线追踪效果.
已经上市的几款支持光线追踪的游戏中,《地铁: 离去》采用的便是全局光照, 这是目前光影效果营造比较好的游戏之一, 但是对于硬件性能要求也极高."GTX 显卡基本运行不了, GTX 1080Ti 只有 16 帧, 而 RTX 2060 则可以跑到 30 帧以上, 可以运行",NVIDIA 产品经理解释道.
《战地 V》融入的光线追踪效果只是反射(包括高级反射), 其展现的效果包括水面, 汽车, 以及武器上的反射等; 而《古墓丽影: 暗影》只采用了阴影, 虽然阴影的计算量也很大, 但是其带来的直观感受并没有反射那么震撼, 这也是很多游戏玩家表示其光影效果展示并不是很好的主要原因. 而即将支持光线追踪的《原子之心》则采用了反射和阴影两大效果.
NVIDIA GTC 2019 上, 老黄宣布, 未来将有更多显卡支持光线追踪, 包括此前帕斯卡架构的 GTX 显卡
从目前 NVIDIA 提供的解决方案来看, 针对多重复杂光线追踪效果和光线数量较多的游戏, NVIDIA 推荐显卡为 RTX 2060 及以上, 而对于基础光线追踪效果或者光线数量较少的游戏, NVIDIA 推荐显卡则为采用帕斯卡或图灵架构的 GTX 显卡, 以及 VOLTA 架构的 TITAN V 显卡. 而 DLSS 技术也将帮助一些性能不足的显卡提供光线追踪方面的优化.
DLSS(深度学习超级采样): 性能不足时的补偿
对于 DLSS,NVIDIA 给出的解释是, DLSS 的收益是和游戏帧数成反比的, 当显卡的性能较差时 DLSS 会提供更好的效果. 简单来说, DLSS 是 NVIDIA 针对硬件性能不足时提供的一种 AI 算法优化.
举个例子, 一款游戏在 2K 分辨率开光线追踪后的游戏帧数只有 30 帧, 无法流畅有运行, 此时开启 DLSS 后显卡会将游戏原始的分辨率降低以提升游戏帧数, 并通过 Tensor Core 把降低的这部分分辨率补回来, 最终实现性能提升.
NAS: 更节省 Shader 资源的图像渲染
此外, NAS(自适应着色技术)的加持也能够显著提升游戏性能. 我们知道图像渲染是需要利用 Shader(着色器, 集成于 DX12)中的资源, 一个画面里并不是所有的部分都需要用百分之百的精度去做渲染, 比如阴影部分用百分之百的精度和百分之八十的精度看上去没什么区别. NAS 技术便是根据每一帧画面中的场景利用不同的精度做渲染, 在保证输出图像和原始画质完全相同的前提下节省了 40% 左右的 Shader 资源, 以实现游戏性能的显著提升.
图灵架构 GTX 显卡: 电竞类游戏的深度布局
不同以往, NVIDIA 将图灵架构显卡划分了两条产品线 --RTX 和 GTX, 二者显著差异就是 RTX 是搭载 RT Core 和 Tensor Core 两个硬件加速核心, 而 GTX 没有.
这遭到了很多网友的质疑,"既然光线追踪这么好, NVIDIA 为什么还要将 RT Core 和 Tensor Core 拿掉?"
显然, 这是 NVIDIA 的又一策略. 市场调研数据显示, 目前 PC 端最火的五款游戏分别为《英雄联盟》,《CS:GO》,《堡垒之夜》,《绝地求生》, 以及《守望先锋》, 这些游戏大多都是电竞类游戏. 这些游戏的共同特点是, 没有加入过多的新技术, 但玩家数量又非常庞大, 而且对游戏硬件要求也不是很高, 可能很老的平台游戏帧数也很高, NVIDIA 希望通过技术上的改进让这类游戏玩家 (电竞选手) 获得更多利益.
NVIDIA 显卡产品经理表示,"对于所有电竞选手来说, 游戏响应延迟是非常关键的, 因为他们每一个操作都非常迅速, 基本上每 200 毫秒就会有新操作(正常人大概是 300 毫秒), 他们需要更低延迟的画面. 为此, 电竞选手需要两大硬件支持, 一是更快, 延迟更低的显卡, 而是更高刷新率的显示器."
举个简单的例子,《CS:GO》在英特尔核显, 和 NVIDIA 以前老显卡 GTX 750Ti 都能够流畅运行, 但是相比目前图灵架构的 GTX 显卡, 还是有很大延迟的, 这会对玩家的游戏成绩造成影响.
同时, NVIDIA 的调研报告显示, 随着时间的积累, 电竞游戏玩家在更好的硬件支持下能够更快的提升游戏成绩, 硬件越好, 游戏成绩提升的幅度也越大. 不过, 每个人的情况都有所不同, 但总体趋势是这样.
NVIDIA 表示, 尽管 GTX 系列显卡没有加速核心, 但是它依然属于图灵架构, 依然可以获得图灵架构带来的游戏增益.
以《古墓丽影: 暗影》为例, 游戏过程中每 100 个指令集里大概有 38 个是做整数的, 62 个是做浮点的. 如果用以前帕斯卡架构显卡来做处理, 它的整数和浮点是没有办法同步执行的, 只能先做浮点, 再做整数, 在做浮点的时候, 整数的那部分就要闲置, 这无疑是浪费时间. 在新的图灵架构中, GTX 1660Ti 只需要 62 个指令就可以把所有 100 个指令全部完成, 实际执行效率提升 38%, 一定程度上提升了游戏性能.
图灵架构移动端 GTX 显卡: 性能全面提升的新游戏平台
2019 年 4 月 23 日对于科技圈来说注定是一个不平凡的日子, NVIDIA 图灵架构 GTX 移动端显卡与 Intel 第九代酷睿移动端处理器的同时解禁, 令全球游戏玩家能够同时享受到新处理器和新显卡带来的全面游戏性能提升, 而游戏本的基础性能也将被带入一个新的高度.
NVIDIA 公布的数据显示, 全新图灵架构移动端显卡 GTX 1660Ti 拥有媲美 GTX 1070 的性能, 但是却支持更多的新技术(包括 DXR 光线追踪), 并拥有更低的功耗. 对于《绝地求生》,《堡垒之夜》,《Apex》这类游戏, GTX 1660Ti 在游戏本 1080P 分辨率高画质下都能跑到 100 帧以上, 能够带来非常良好的游戏体验, 相比 GTX 1060 拥有 30% 左右的提升.
在与帕斯卡架构 GTX 1060 显卡游戏性能对比的数据中, 移动端 GTX 1660Ti 显卡在新游戏上的性能表现会更出色, 越是新发布的游戏, 图灵架构领先的百分比越高. 当然, 2015 年的老游戏也有很多人玩, 但是随着时间的推移, 游戏玩家更多的都会去玩新游戏, 而图灵架构会因此带来更多的游戏性能收益.
图灵架构中, NVIDIA 还更新了直播部分的一个编码, 该编码可以在不影响 CPU 性能的前提下提供更优秀的直播画质. 实际体验过程中, CPU 占用率只有 2%, 也不会额外占用显卡资源, 而这完全仰仗于图灵架构中的一个专门的 Encoder(解码器).
OPTIMUS 也是新一代图灵架构笔记本中非常棒的技术加持, OPTIMUS 技术可以帮助游戏玩家在游戏和视频上网模式下自由切换独显和核显, 令日常上网等模式能够自动关闭 GEFORCE, 独显, 选择核显, 进入省电模式, 带来更持久的续航时间.
此外, 另一款入门级移动端显卡 GTX 1650 相比 GTX 950M 拥有 2 倍的性能提升, 相比台式机 GTX 1050 拥有 1.7 倍的性能提升, 主流游戏都可以达到 60 帧, 适合入门级玩家.
近期发布的搭载 GTX 1650/1660Ti 显卡的新雷神 911 游戏本
NVIDIA 表示, 搭载全新图灵架构 GTX 1660Ti 显卡的游戏本是针对三到四年游戏本更换周期推出的产品, 相比之前的 GTX 960M,GTX 1660Ti 拥有大约 4 倍的性能提升, 同时处理器, 内存, 硬盘, 以及屏幕刷新率都有了大幅度提升, 机身也更加轻薄.
来源: http://www.tuicool.com/articles/JJbQZfM