跑跑车游戏网
游戏
网游单机小游戏专题排行榜攻略资讯评测
软件
11应用专题排行榜教程
关于
广告合作网站地图意见反馈

GTX1080新技术大幅强化VR性能

Sam2016/05/18评论 (0)

NVIDIA 技术行销资深总监尼克‧斯塔姆(Nick Stam),日前特别来台说明日前在美国发表、预定 5 月底上市的显示卡新产品「GeForce GTX 1080」的特色与规格功能详情,供玩家参考。

尼克‧斯塔姆介绍「GeForce GTX 1080」

  GeForce GTX 1080 是採用 Pascal(帕斯卡)架构的 GeForce 10 系列首款产品,首度以 16 奈米 FinFET 製程製造,搭配 8GB GDDR5X 高速绘图记忆体,可提供超越两张 GeForce GTX 980 SLI 或单张 GeForce GTX TITAN X 的处理效能,是目前效能最高的 GeForce 系列显示卡产品。

  NVIDIA PC 事业部资深副总裁杰夫‧费雪(Jeff Fisher)表示:「PC 是全球用户最喜爱的游戏平台,而我们全新的 Pascal GPU 架构将 PC 推升至更高的境界。我们首款 Pascal 游戏 GPU GeForce GTX 1080 不仅实现游戏中极其逼真的场景与更身历其境的沉浸式 VR 体验,更显著提升效能与能源效率。它不只是史上最强悍的游戏 GPU,也是我们精心开发最优秀的作品之一。」

  GeForce GTX 1080 採用的 Pascal 架构,搭载了以下的新技术:

新一代 GPU 架构:Pascal 针对每瓦效能表现进行优化,使 GeForce GTX 1080 的能源效率达到 Maxwell 架构的 3 倍以上

16 奈米 FinFET 製程:GeForce GTX 1080 是首款针对 16 奈米 FinFET 製程进行设计的游戏 GPU,採用更小更快的电晶体,以更高的密度封装至晶片内。GPU 内含 72 亿个电晶体,能大幅提升效能表现与能源效率。

先进记忆体:Pascal 架构 GPU 率先採用美光公司 8GB GDDR5X 记忆体,搭配 256 位元记忆体介面,传输率高达 10Gbps,使记忆体频宽效率较一般 GDDR5 高 1.7 倍。

极致工艺:频宽与能源效率的提升让 GeForce GTX 1080 的时脉提升至 1700MHz 以上,耗电仅有 180 瓦,只需要单一 8 Pin 额外电源供应即可运作。全新非同步运算模式增进能源效率与游戏效能,全新 GPU Boost 3 技术则是支援更先进的超频功能。

突破性游戏技术:全新 NVIDIA VRWorks 软体功能让游戏开发者得以将前所未有的临场感带入各种游戏环境中。NVIDIA Ansel 技术让游戏玩家能以崭新的方式分享自己的游戏体验以及探索游戏世界。

  尼克‧斯塔姆现场以 4 大主题来深入介绍 GeForce GTX 1080 的特色。

艺术形式(New Art Form)

  NVIDIA 伴随 GTX 1080 同步发表了「NVIDIA Ansel」技术,该技术是以游戏画面撷取为诉求的工具,能轻鬆整合到游戏中。透过 Ansel,玩家能突破以往只能撷取游玩当下所见画面的限制,自由从不同的视角来截取游戏画面,不论是拉近、拉远、拉高、拉低、旋转等,都能因应玩家喜好调整。而且撷取时不侷限于游戏实际运行的解析度,而是能拉大到最高 32 倍的解析度输出。此外还能撷取 360 度 3D 环景画面,搭配 Google Cardboard 等 VR 装置即可观赏身历其境的截图

自由摄影

超高解析度

360 度环景截图

  Ansel 活用 GeForce GPU 提供的 CUDA 可程式化运算功能来处理游戏画面撷取的运算,可以快速处理高倍解析度撷取的合併,或者是替撷取的画面加上诸如 LOMO 之类的滤镜效果等。

  Ansel 具备容易整合的特性,以目前导入 Ansel 支援的两款游戏为例,《The Witness》只需要加入 40 行程式码即可,《巫师 3:狂猎》则只需要 150 行程式码。操作部分则是透过 Ansel 提供的便利侧栏介面来控制。尼克强调,是否要整合 Ansel 端看游戏性质而定,如果是无法暂停的即时连线游戏,就不适合使用 Ansel。另外因为截图时玩家可以自由移动摄影机视角,因此可能会洩漏一些玩家不该看到的东西。能否加入 Ansel、要加上什麽限制,都可以由游戏开发者自己决定。

透过游戏截图来进行摄影创作已经成为一个新兴趋势

全新音效表现(New Sound)

  目前虚拟实境(VR)话题正热,但多数都是集中在「影像」的呈现上。不过对于 VR 的沉浸体验来说,「声音」的表现同样具有画龙点睛的效果。良好的音效表现,对 VR 体验的帮助不只是「加法」而是「乘法」。因此这次 NVIDIA 特别在 VR 软体开发套件「VRWorks」中整合了崭新的「VRWorks Audio」技术,运用先前收购的 NVIDIA OptiX 光迹追踪引擎,即时追踪环境中的多个声音,让使用者听到的音效能完全反映出虚拟世界中物体的大小、形状以及材质。目前该技术最多能同时模拟 16000 条声波射线进行最多 12 次反射运算,来模拟真实世界中複杂的声波传递。

  此外,NVIDIA 还运用持续更新的「NVIDIA PhysX」技术来满足 VR 体验所需要的互动式触碰与物理模拟,能侦测像是 HTC Vive 控制器之类的体感控制器与虚拟物体的互动,让游戏引擎提供符合物理法则的视觉与触觉反应。此外还能建构使用者对虚拟世界周遭的物理行为模型,让不论是爆炸、燃烧、水波、液体流动、布料与毛髮飘逸等互动,都能呈现宛如真实世界一般的样貌。

  为了让玩家充分体验 VRWorks 搭配 Pascal 显示卡所能提供的丰富功能,NVIDIA 特别开发了一款名为《NVIDIA VR Funhouse》的 VR 技术展示游戏,採用 Unreal Engine 4 打造,搭配 HTC Vive 游玩。透过游乐园的娱乐设施来体验先进的 VR 效果。除了 VR 影像与声音的呈现之外,还能感受诸如碰撞、液体、燃烧、毛髮等物理模拟特效。该展示预定近期内在 Steam VR 上推出。

新效能王者(New King)

  GTX 1080 採用新一代 Pascal 架构搭配 16 奈米 FinFET 製程与 GDDR5X 高速记忆体,提供高达 9TFLOPS 的单精度浮点数运算效能,一举超越前代霸主的 GTX TITAN X(约 6TFLOPS),成为 GeForce 家族中新一代的效能王者。

GeForce GTX 1080:9TFLOPS

GeForce GTX TITAN X:6.14TFLOPS

GeForce GTX 980Ti:5.63TFLOPS

  尼克‧斯塔姆强调,其实不只是架构与製程的更新,NVIDIA 在 Pascal 上还投注了高度的工艺技术心血,让该架构达到前所未有的效益。他透露,原本 Pascal 架构晶片在开发初期的增幅时脉只能达到 1325MHz,但是在整体电路布局最佳化的努力之下,最后达到 1733MHz,提升了 30% 之多。因此工艺技术的投入,是不亚于新架构与新製程的关键之一。

  GTX 1080 採用代号「GP104」的图型处理器核心,由 72 亿电晶体构成,搭载 2560 个单精度浮点数 CUDA 核心,提供约 9TFLOPS 的单精度浮点数运算效能。由于是针对 3D 图形处理应用,因此倍精度浮点数运算效能只有单精度的 1/32,比例比高效能运算用途的「Tesla P100」採用的 GP100 核心低很多(1/3),不过 GP100 的电晶体高达 153 亿个,两者的规模相差很大。

  预定稍晚推出的 GTX 1070 同样採用 GP104 核心,有效运算单元是 GTX 1080 的 3/4,搭载 1920 个 CUDA 核心,提供约 6.5TFLOPS 的单精度浮点数运算效能。记忆体则採用 GDDR5。

  GTX 1080 具备 20 组 Streaming Multiprocessors(SMs),每组包含 128 个 CUDA 核心以及 1 组 PolyMorph Engine,其中搭载了新的 Simultaneous Multi-Projection 处理单元(后述)。

  在 DirectX 12 导入的「非同步运算(Asynchronous Cimpute)」支援部分,先前的 Maxwell 只支援「静态负载分割(Static Load Patitioning)」,这次 Pascal 则是导入了新的「动态负载平衡(Dynamic Load Balancing )」,当并行处理的图形处理与数值计算其中一方先处理完毕后,可以立刻将资源释出供另一方运用,减少资源閒置、缩短处理时间。

  在 Preemption(抢占式多工)的部分,Pascal 首度支援像素(Pixel)单位的多工切换,GPU 可以在绘製多边形内部单一像素时暂停此一工作切换到其他工作,之后再切回来继续处理。DX12 数值计算则能以执行绪单位切换,CUDA 运算则是能以更细微的指令为单位切换。切换的延迟低于 100 微秒(100μs,即万分之一秒)。藉由高速多工切换的特性,Pascal 在 VR 应用下能更快速在图形处理与非同步时间调整(Asynchronous Timewarp)两个工作之间切换,减少效能閒置。

  此外,GTX 1080 还支援新一代高速绘图记忆体标准「GDDR5X」,传输速度从前代的 7Gbps 提升至 10Gbps,提升超过 40%,提供高达 320GBps 的记忆体频宽来满足运算效能提升的需求。

  除了记忆体频宽提升之外,Pascal 同时也提升了记忆体压缩处理的效率,改良原本的 2:1 压缩模式的处理,并新增 4:1 与 8:1 模式,增加了有效压缩的范围,提供约 1.2 倍于前代的压缩效率。搭配 1.4 倍频宽与 1.2 倍压缩效率,让 GTX 1080 能提供 GTX 980 1.7 倍的等效记忆体频宽。

Maxwell 架构与 Pascal 架构画面压缩适用范围的比较,桃红色为有效压缩范围

新技术(New Tech)

同步多重投射

  显示器的技术进步与价格降低,让现在的使用者不再侷限于单萤幕的设置,逐渐走向多萤幕、曲面萤幕乃至于 VR 头戴显示器,而这些应用都与以往的单画面输出有很大的差别。为了因应萤幕多样化的趋势,Pascal 导入了全新的「Simultaneous Multi-Projection(同步多重投射)」技术。

  在 3D 绘图中所谓的「Projection(投射)」,是指将完成几何运算后所产生的 3D 多边形物件投影到萤幕显示的 2D 平面(Viewport)上的处理,这些投影到平面上的几何资料接著会进行渲染(Render),以呈现在使用者眼前。以往的 GPU 同一时间只能处理 1 个投射面,因此在遇到多萤幕输出时,只能将多萤幕视为同一平面来进行投射,无法在单一次处理中针对个别萤幕摆设的角度来修正投射的角度,只能透过多次绘製画面的方式来达成,但如此会大幅提升处理负担。

  而 Pascal 导入的「Simultaneous Multi-Projection」技术,则是可以同时支援最多 16 个投射面的处理,让单次计算好的几何资料可以同时产生多组不同的投射面来进行渲染,不但能配合多萤幕设置修正画面角度、让多萤幕的宽广视角能有更自然的呈现,还能提升 VR 图形处理的效率。

  VR 头戴显示器的画面输出需求比目前主流的宽萤幕游戏画面输出要高上许多。传统的宽萤幕画面输出只需要 1920 x 1080 最低 30fps(每秒 60Mpixels) 就能被多数玩家接受,但是 HTC Vive 的 VR 画面则需要 2 组 1680 x 1512 的画面,且更新率必须维持最低 90fps(每秒 450Mpixels),是 1080p 30fps 的 7 倍以上。因此如何节省 VR 画面处理的负担,已成为今后 GPU 的重点。

  Pascal 导入了多种 Simultaneous Multi-Projection 技术的应用来达成节省 VR 画面处理负担的需求。首先是以「Single Pass Stereo Rendering(单次立体渲染)」同时产生 VR 装置左右两眼的 3D 画面,节省一半的几何运算负担。接著则是进一步配合 VR 装置藉由透镜修正平面萤幕画面来产生球状包覆视野的特性,以「Lens Matched Shading(符合透镜特性的著色处理)」将左右画面分割成中间凹陷的 4 个相连投射面来处理,节省传统处理方式浪费的无谓画面范围,让所需处理的像素大幅减少。以 Oculus Rift 来说,单一画面就能从原本的 2.1Mpixels 减少到 1.4Mpixels。

开启「Single Pass Stereo Rendering」后,画面更新率从 60fps 提升至 90fps

配合 VR 头戴装置透镜特性的「Lens Matched Shading」(左图)

  藉由这些技术的搭配,Pascal 架构能提供 2 倍于 Maxwell 架构的几何运算吞吐量、1.5 倍于 Maxwell 架构的像素运算吞吐量。因此 GTX 1080 在 VR 图形处理的应用上,能获得比帐面浮点数运算效能提升幅度更大的效能提升,达到前代霸主 GTX TITAN X 的 2 倍效能与 3 倍效益。

Pascal 架构在 VR 处理时能提供 Maxwell 架构 2 倍的几何运算吞吐量、1.5 倍的像素运算吞吐量

GTX 1080 在 VR 处理的效能提升比起帐面的运算效能提升更显著

HDR + 4K 输出

  GTX 1080 支援新一代的 HDR(高动态范围)与 4K 解析度影像输出标准,搭载 1 组 HDMI 2.0b 与 3 组 DisplayPort 1.4 Ready 端子,最高能输出到 7K 解析度,最多可同时输出 4 个画面。GTX 1080 支援 10bit HEVC 影像编码与 12bit HEVC 影像解码,可搭配 Shield 进行 HDR 串流画面输出。支援 HDR 输出的游戏将于近期陆续登场,包括《典范》、《古墓奇兵掘起》等。

快速同步

  「Fast Sync(快速同步)」是 NVIDIA 针对《cs:GO》等高画面更新率需求的游戏所提出的新功能,该功能不是 Pascal 专属,只要安装新版 GeForce Experence 驱动程式组即可开启。

  Fast Sync 是基于 V-Sync 加以改良的模式,改善了以往开启 V-Sync 时,游戏引擎必须配合画面更新率运作所导致的高反应延迟,同时避免关闭 V-Sync 的画面撕裂问题。Fast Sync 让游戏引擎保持最高速运作,不去等待萤幕的画面更新,而是持续不断绘製画面,并将最后一张绘製好的画面持续更新到固定的暂存区中,未能显示的画面就直接刷新捨弃。当遇到萤幕画面更新时就直接输出暂存区中的最后一张画面。因此能兼具 V-Sync 开启的完整画面与 V-Sync 关闭的低延迟。

Fast Sync 透过改良 V-Sync 的机制,达成低延迟无撕裂的高更新率画面输出

强化 SLI 介面

  GTX 1080 调整了 SLI 多显示卡组态的参考规格,由于软硬体环境的改变,使得 3-Way 以上的 SLI 效能提升有限、效益偏低,因此未来官方将只支援 2-Way SLI,不再支援更高的 SLI。而以往为了串连超过 2 张显示卡所设的 2 组 SLI 接头,在 GTX 1080 上会合併在一起,提供 2-Way SLI 更充裕的频宽。官方同时推出新版的 SLI 高频宽桥接器,能以更高时脉运作(650MHz)。虽然使用者还是可以使用既有的标准桥接器,只不过运作时脉(400MHz)会比新版的宽桥接器低。

GPU Boost 3.0

  在狂热玩家关注的 GPU 超频部分,先前的 GPU Boost 功能,只提供一个保守的线性偏移量来做为运作电压与运作时脉的设定值,但实际上 GPU 在不同电压下能达到的运作时脉上限并不是一个线性变化的值,之间还有进一步提升的空间在。这次 Pascal 导入的 GPU Boost 3.0 则是採用更精确的设定,可以透过软体扫描个别 GPU 在特定电压下的极限,设定出一个最逼近上限的参数曲线,达成极致超频的目标。

创始版

  以往由 NVIDIA 官方推出的显示卡,往往被消费者认为是规格最为基本的「公版」,缺乏品牌认同感。因此 NVIDIA 在这次的 GTX 1080 与 GTX 1070 採用了不同的做法,推出了精心打造的「创始版(Founders Edition)」,採用极具设计感的高档外观设计,配备高效率的散热系统。

  这款创始版将强制採用全球统一的设计,不论是任何板卡厂商推出的产品,只要冠上创始版的名号,就会具备相同的外观与规格,以凝聚使用者对 GeForce 品牌的认同感。目前 NVIDIA 发表与展示的就是创始版,官方只会推出这一个版本,不会有低阶的公版产品。板卡厂商还是可以推出自行设计的产品,只是这些产品就不能称作创始版。

  NVIDIA GeForce GTX 1080 预定 5 月 27 日上市,板卡厂商客製化版本参考零售价 599 美元(约新台币 19550 元),创始版预估零售价 699 美元(约新台币 22800 元)。

  NVIDIA GeForce GTX 1070 预定 6 月 10 日上市,板卡厂商客製化版本参考零售价 379 美元(约新台币 12360 元),创始版预估零售价 449 美元(约新台币 14650 元)。

  包括华硕、七彩虹、EVGA、耕宇、影驰、技嘉、Innovision 3D、微星、NVIDIA、同德、PNY、以及 Zotac 等厂商都将推出 GTX 1080 / GTX 1070 显示卡。

上一篇nvidia显卡怎么设置_fps提高方法

下一篇NVIDIA Projcet SHIELD图片欣赏

网友评论
取消

累计评论0

展开其余评论

相关阅读

上滑或点击查看更多...