Hi!请登陆

RTX3080用的GDDR6X顯存有什麼大不同

2020-9-11 52 9/11

這幾天 PC 業界最火爆的新聞肯定就是 NVIDIA 發佈新一代 RTX 30 系列顯卡,沒有之一。新的顯卡自然是使用瞭搭配有一系列新技術的新核心,比如說第二代 RT Core 啊,第三代 Tensor Core 啊這些。而對於 RTX 3080 和 RTX 3090 這兩張高端顯卡,它們 GPU 核心的外部,作為倉庫的顯存也有很大的變化,具體一點就是從 GDDR6 升級成瞭全新的
GDDR6X。

想必還有很多讀者記得當年在高端 Pascal 顯卡上面出現的 GDDR5X 顯存,它是 NVIDIA
和美光聯手合作研發出來的顯存種類,隨後被提交給瞭 JEDEC 進行標準化。不過可惜的是,除瞭美光之外,沒有其他內存廠采用該標準生產顯存產品,而顯卡市場上,除瞭高端的幾張 Pascal 顯卡外,也沒有別的顯卡采用 GDDR5X 顯存,就連 NVIDIA 自己也在之後就轉向瞭更高速的 GDDR6 顯存。

NVIDIA 在 2018 年的 Turing 顯卡上面首次應用瞭 GDDR6 顯存,在當時,GDDR6 顯存能夠提供比疲態盡顯的 GDDR5 高的多的帶寬,也讓 GDDR5X 黯然失色。在 GDDR6 顯存正值壯年的現在,NVIDIA 卻再次聯手美光,在短短的兩年之後就推出瞭它的進階版本,那麼到底是什麼原因讓 NVIDIA 決心換用
GDDR6X,它的背後隱藏瞭哪些技術,又能帶來哪些好處呢?本期超能課堂就講一講 GDDR6X 顯存和它背後的全新技術。

顯存是顯卡用來存放各種計算、渲染用素材的倉庫,GPU 在執行圖形計算任務的時候,會不停地從這個倉庫裡面拿東西,而 CPU 也會不停地把數據傳遞過來,要 GPU 塞進倉庫裡面備用。那麼這個倉庫的大小,存取素材的快慢會很明顯地影響到 GPU 的工作效率,也就是說,顯存的大小和顯存的帶寬都會對顯卡的整體性能產生影響。

而在如今,1080p 分辨率早已普及,不少玩傢已經開始用上 1440p 分辨率或者是 4K 分辨率的顯示器或電視,在更高的分辨率下,遊戲的材質、紋理等原始數據的體積越來越大,在進行圖形計算時所需的數據交換帶寬越來越高,這就需要顯卡設計廠使用有更高帶寬和容量的顯存系統,這也是 NVIDIA 和 AMD 兩傢一直在提升他們顯卡的顯存規格的緣由。

上一代的 GDDR6 顯存將數據的預取寬度從 GDDR5 時代的 8-bit 拓寬到瞭
16-bit,這讓它的等效頻率再次倍增,能夠達到 14~16Gbps 左右,在顯存位寬相同的情況下,其帶寬較 8Gbps 的 GDDR5 顯存高 75%~100%,進步非常巨大。而 GDDR6X 做到瞭更高的等效頻率,其范圍為 19~21Gbps,也就是說,同顯存位寬的情況下,它能夠增加 35%~50% 的顯存帶寬,達到 912GB/s~1008GB/s,正式突破瞭 1000GB/s 這個大關。

但是 GDDR6X 如果強行用傳統方式,也就是提升運行頻率的方式去獲取帶寬的話,會遇到非常大的困難,比如說受到工藝的制約,它的運行頻率去不到更高,即便是能夠實現更高的等效頻率,其信號的純凈度也會大打折扣,在電氣性能上無法滿足要求。

那麼該如何去推高它的等效頻率呢?NVIDIA 和美光選擇從信號的調制方式上入手。

原本的 GDDR 系顯存在傳輸數據時使用的是非常原始的二進制信號,再具體一點,該系列顯存使用的是 NRZ(Non-Return-to-Zero)調制,或者叫做 PAM2 調制。這種信號調制方式很簡單,它用高電平代表 1,低電平代表
0。如果要提高它的數據傳輸速率,隻要提高顯存的時鐘頻率即可。但現在由於受到制程工藝等各方面因素的限制,顯存的時鐘頻率在現階段已經很難再攀高,那麼該怎麼辦呢?廠商想到瞭用新的信號調制機制來提高信號傳輸的效率,他們選擇瞭已經有較為廣泛的 PAM4。

PAM 是一種用模擬信號脈沖編碼信息的信號調制方式,PAM4 是其中較為簡單的一種。與 NRZ
這種僅有高和低兩種狀態的二進制信號不同的是,PAM4 有 4 種不同的電平值,也就是有 4 種不同的狀態,而每種狀態對應著一組 0 和 1 的組合,也就是說,它的每個狀態對應瞭 2 個 bit 的數據量,較 NRZ 是翻倍的。

如果這麼說還有些模糊的話,這裡可以將 PAM4 信號類比成 MLC 閃存存放數據的方式。我們知道,MLC 閃存的每個單元可以存放 2-bit 的數據,在電信號層面上它表現為 4 種不同的電平,每個電平之間有固定的電壓間隔,主控在讀取和寫入的時候都按照固定的規則將數據和電信號進行轉換。

那麼 GDDR6X 也是如此,根據 NVIDIA 公佈出來的信息,GDDR6X
有四種不同的電平信號,每個電平信號之間的電壓差為 250mV。

在采用 PAM4 調制之後,顯存系統的信號純凈度有瞭一個很大的提升,有圖為證:

上為 GDDR6,下為 GDDR6X

在換用 PAM4 之後,如果繼續沿用原本的 16n 突發讀取長度,那麼每次將會讀取到 32-bit 的數據,為瞭保證兼容性,GDDR6X 將 Burst Length 降回瞭 GDDR5 時代的 8n,這樣每次的預取數據仍然為 16-bit。

NVIDIA 的黑魔法加持

為瞭更好的配合和利用 GDDR6X 顯存,NVIDIA 還應用瞭一些自己的黑魔法技術,比如 MTA(Max Transition Avoidance)編碼就是其中之一。

MTA 編碼是 NVIDIA 的專利技術,它是一項用於配合 PAM4 信號調制方式的技術,原理是將原本全長為 16-bit 的突發數據分割成兩部分進行發送,以降低信號在傳輸過程中出現的誤碼、損耗等問題。

不可否認的是,當代顯卡上的顯存能耗是越來越高瞭,一個是運行的頻率高瞭,另一個因素是容量大瞭。而 GDDR6X 的一大特點就是能夠提供更高的能效比。

美光提供的數據顯示,同樣的 8 顆顯存,等效頻率為 21Gbps 的 GDDR6X 顯存的能效比跟 14Gbps 的
GDDR6 顯存在每比特能耗上要低 15%。要知道,在此同時 GDDR6X 還提供瞭多 50% 的顯存帶寬。

由於 GDDR6X 顯存是 NVIDIA 和美光聯手研發的,它暫時還沒有被 JEDEC 給標準化,所以也沒有第二傢能夠生產 GDDR6X 顯存的內存生產商。

目前美光提供兩種 GDDR6X 顆粒,容量密度均為 8Gb(單顆 1GB),兩種顆粒的區別隻有頻率,後綴為 19
的顆粒等效頻率為 19Gbps,後綴 21 的顆粒等效頻率為 21。很明顯,在 RTX 3080 上出現的就是型號為 MT61K256M32JE-19 的顆粒,但 RTX 3090 的顯存顆粒現在還不明朗。

由於 GDDR6X 采用瞭完全不同的信號調制方式,所以 GPU 的內存控制器需要進行重新設計才能支持它,目前 NVIDIA 應該也隻是計劃隻在 GA102 核心上做它的支持,而定位更低的 GA104、GA106 等核心應該都隻支持 GDDR6。在 RTX 3070 及之下的 RTX 30 系顯卡和未來可能的 GTX 26 系列顯卡上,我們看到的應該仍然是 GDDR6 顯存。

GDDR6X 在 GDDR 傢族中首次應用瞭 PAM4 信號調制方式,提升瞭信號傳輸的效率,能夠以更低的時鐘頻率達成同樣的等效頻率。PAM4 信號調制方式也並不是什麼新的技術,它在高速以太網中早已經被廣泛應用,而且目前正處於規劃中的 PCIe 6.0 總線也計劃將信號調制方式從 NRZ 切換到 PAM4
上去,在頻率提升已經達到物理極限的時候,更高效率的信號調制方式就是新的用來提升帶寬的手段瞭。

由於 GDDR6X 和 GDDR5X 類似,是 NVIDIA 和美光合作開發的,所以短時間內我們很難看到采用 GDDR6X
的 A 卡,也很難說美光會不會將 GDDR6X 提交給 JEDEC 進行標準化。就之前 GDDR5X 的情況來看,GDDR6X 應該不會像 GDDR6 那麼普及,主流級別的顯卡將仍然采用 GDDR6 顯存,而專業級的 GPU 則會選擇有更大帶寬的 HBM。

或許我們不會看到標準化的 GDDR6X,但未來比 GDDR6 更新的標準可能會吸收 GDDR6X 上所使用的新信號調制方式。它可能不會很普及,但它確實是顯存發展的一個未來方向。

Tag:

相关推荐