詳解DX12終極版:NVIDIA顯卡/AMD顯卡遊戲效能大升級

微軟已經推出DirectX 12的最新升級版——DirectX 12 Ultimate,這可以說是DirectX 12從2015年正式上線以來最為重大的一次更新,它加入了許多新的特性,實際上其中的部分特性已經在去年十月份已經預告過了,原本它應該會作為Direct3D 12 Feature Levels 12_2出現的,不過這次微軟改名部上線了,給新版本DirectX 12加了個“Ultimate”的尾碼,那今後比DirectX 12 Ultimate更強的新版本會叫什麼呢?

首先DirectX 12 Ultimate中新增的特性主要有四大塊,分別是DirectX Raytracing 1.1、可變速率渲染、Mesh渲染器和採樣器回饋(Sampler Feedback)。

DirectX Raytracing 1.1

DirectX Raytracing(DXR)是微軟在2018年為DirectX 12引入的新特性,讓它支援即時光線追蹤處理。1.0版本的DXR在軟體特性上比較基礎,可以說它是圍繞著Turing架構的硬體實現而設計的,當時也沒有從軟體發展角度去考慮如何實現光追。而1.1版本擴展了DirectX 12在光線追蹤方面的軟體特性,讓它的效率更高,同時對開發者也更友好。主要有三點:

允許GPU直接調用光追

跑在GPU上面的著色器在1.1版本中可以直接調用光線追蹤,而無需折返CPU來調用。這項功能對於自我調整光線追蹤場景非常有用,尤其是在基於著色器實現的剔除、排序、分類和細化等場景中。基本上今後的光線追蹤工作可以在GPU上面準備並立即生成。

按需載入光線追蹤著色器

當玩家在遊戲世界中移動、新的物件變為可見的過程中,流式引擎可以根據此時的畫面需求來載入新的光線追蹤著色器,提高處理過程的效率。

內聯光線追蹤

內聯光線追蹤(Inline raytracing)是目前基於動態著色器的光線追蹤的一種替代形式,你可以將其理解為一種簡化的光線追蹤。開發者在內聯光線追蹤過程中將有更大的控制權,並且可以在任意的著色階段調用它,包括計算著色和圖元著色階段。它與傳統基於動態著色器的光線追蹤可以混合使用,對於簡單的場景,內聯光線追蹤將會提供更好的性能表現,而在複雜場景中,基於動態著色器的光線追蹤將會提供更好的運行效果。

可變速率著色

可變速率渲染(Variable Rate Shading)是一項由NVIDIA在其Turing GPU上率先引入的加速著色特性,具體介紹可以看我們的課堂文章:《超能課堂(212):VRS可變速率著色為什麼可以提高幀數?》,這邊就簡單講一下它的原理,而不再贅述細節了。

簡單來說,VRS的原理是通過改變單次圖元著色器操作所處理的圖元數量,來改變螢幕不同區域的著色品質。簡單來說,它可以改變同個畫面中不同部分的渲染精細度,它的用處是提高畫面幀數。

在不開啟VRS的情況,也就是正常情況下,一幀畫面的所有圖元都是獨立著色的;而開啟VRS之後,原本獨立的圖元被分成了一個個區塊,它們會共用著色結果,此時GPU會根據程式師設定的重要性分級為所有區塊分配不同的著色精細度。拿上面的圖片為例,車輛和遠景部分的圖元仍然是獨立著色的,但快速變動的道路和路邊的區塊就是區塊共同著色的,此時由於顯卡的計算資源得到了節約,所以遊戲的幀數會有所提高。

在NVIDIA以外,Intel已經在Ice Lake處理器中的第11代核顯中加入了針對VRS的支持,而AMD方面則暫時沒有相關支援,不過他們也已經宣佈將會在RDNA 2架構中加入相關支持。

Mesh著色器:下一代幾何處理管線的基礎

在過去的二十年中,傳統的幾何圖形處理管線已經增加了好幾個階段了,不過它的核心理念仍然基於傳統的光柵化預著色方法的,放在今天已經過於複雜,並且拖累處理效率。硬體和軟體發展者都希望改變這一現狀,於是,DirectX 12引入了Mesh著色器,它為開發者提供了前所未有的可程式設計能力。

原本的管線中,GPU硬體的並行能力被隱藏,或者說是被自動化了,硬體會説明打包操作然後並存執行它,這很高效,但也存在問題——靈活性不夠。

Mesh著色器就完全改變了這一過程,它不再是針對單一頂點或圖元的單一函數,而是工作在整個計算執行緒組中。在某一階段中,Mesh著色器的每個執行緒都是針對一個頂點,而在另外一個階段,每個執行緒針對著一個圖元。整個執行緒組的記憶體是共用的,訪問靈活度很高,同時開發人員對硬體的控制權也更大,甚至還能啟發新的技術,節約記憶體使用量和記憶體頻寬。

與Mesh著色器一同出現的還有一個可選的放大著色器(Amplification Shader)階段,它運行在Mesh著色器之前,計算得到需要多少個Mesh著色器,並啟動他們。

採樣器回饋

最後一個大特性就是採樣器回饋(Sampler Feedback),先說效果:更好的視覺品質、更短的載入時間和更少的卡頓。它的核心思想實際上就是讓程式只載入必要的紋理,把資源交給更有需要的地方。

採樣器回饋是允許遊戲引擎去跟蹤紋理採樣器的使用方式,讓後者向引擎提供回饋,方法是生成“回饋圖(Feedback Map)”,它會記錄不同紋理區域的不同駐留等級,然後程式可以根據這些回饋資訊來做決策——包括該如何使用紋理採樣器和要在顯存中保留哪些資源等。這比原先的流程更為精確,可以更好地分配計算資源。簡單來說它的實際效果就是用更少的顯存渲染更大、更詳細的紋理。

另外,採樣器回饋還允許了一項新技術——紋理空間著色。它可以在不柵格化物件的情況下進行物件著色,其中心目的就是緩存和重用著色結果,減少GPU的計算量。

總結:面向新圖形架構和下世代主機

在微軟推出DirectX 12 Ultimate之後,NVIDIA和AMD就迅速地宣佈已經/將要支持它,實際上,DirectX 12 Ultimate的絕大部分新特性可以說是基於Turing架構來的,NVIDIA在設計Turing架構時可能預留了相當部分的新特性是沒有公開的。而AMD方面在目前只能說是一個跟進者,要用上新特性,首先要等到年底的RDNA 2架構。

DirectX 12 Ultimate的這些特性很明顯有兩個共通的目標,一是提高開發者對硬體的控制力,二是提高總體計算效率。這也是為下世代主機——Xbox Series X和傳說中的Xbox Series S所準備的,很難說我們要等多長時間才能看到這些特性被應用到實際遊戲中去——至少今年是看不到的,需要等引擎開發商、遊戲開發者對新世代主機做適配或者做專門性的開發後,我們才能在PC遊戲中也看到這些技術的運用。

 

DX12终极版发布!NVIDIA图灵和AMD RDNA2同时支持、Win10 v2004预置

消息來源

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.