加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 1. GPU 加速計算的需求和傳統(tǒng)數(shù)據(jù)傳輸?shù)钠款i
    • 2. NVLink 的設(shè)計目標與技術(shù)特點
    • 3. NVLink 如何滿足 GPU 的數(shù)據(jù)傳輸需求
    • 4. NVLink 的分層協(xié)議設(shè)計
    • 5. NVLink 的技術(shù)演進與系統(tǒng)優(yōu)化
    • 6. NVLink 在實際應(yīng)用中的效果
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

英偉達為什么發(fā)展NVLink 技術(shù)

11/18 10:00
2634
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

1. GPU 加速計算的需求和傳統(tǒng)數(shù)據(jù)傳輸?shù)钠款i

近年來,隨著深度學習、科學計算、圖像處理等領(lǐng)域的發(fā)展,GPU(圖形處理單元)在加速計算方面扮演著越來越重要的角色。GPU 以其強大的并行計算能力,能夠同時處理大量數(shù)據(jù)并執(zhí)行復(fù)雜的計算任務(wù),因此被廣泛應(yīng)用于需要高性能計算的場景。然而,GPU 作為獨立的計算單元,通常需要頻繁地與其他 GPU 和 CPU 之間進行數(shù)據(jù)交換。

在傳統(tǒng)的計算機架構(gòu)中,CPU 和 GPU 之間主要通過 PCIe(Peripheral Component Interconnect Express)總線進行通信。雖然 PCIe 已經(jīng)成為了標準的高速互聯(lián)協(xié)議,但其帶寬有限,隨著計算需求的增長,其數(shù)據(jù)傳輸速度在某些應(yīng)用中已難以滿足 GPU 和 CPU 之間的大量數(shù)據(jù)交互需求。尤其是在深度學習等應(yīng)用場景中,GPU 之間需要共享大量數(shù)據(jù),例如神經(jīng)網(wǎng)絡(luò)參數(shù)和梯度,低帶寬的數(shù)據(jù)傳輸會導(dǎo)致明顯的瓶頸,影響計算效率。

2. NVLink 的設(shè)計目標與技術(shù)特點

NVIDIA 為了提升 GPU 與 GPU、GPU 與 CPU 之間的數(shù)據(jù)傳輸效率,開發(fā)了 NVLink 技術(shù)。這是一種專為 GPU 加速計算設(shè)計的高速互連技術(shù),具有以下幾個主要特點:

高帶寬:NVLink 在 1.0 版本中即提供了每條鏈路雙向 160 Gbit/s 的帶寬,這遠高于 PCIe 3.0 的 32 Gbit/s,極大地提升了 GPU 之間的通信速度。

多鏈路擴展:NVLink 支持多條鏈路連接,每條鏈路能夠獨立傳輸數(shù)據(jù),極大地提高了系統(tǒng)整體的帶寬上限。例如 NVLink 2.0 增加了鏈路數(shù)量和單鏈路帶寬,提供了 300 Gbit/s 的雙向帶寬。

數(shù)據(jù)一致性協(xié)議:NVLink 協(xié)議在設(shè)計時考慮了數(shù)據(jù)一致性問題,使得不同 GPU 之間的數(shù)據(jù)訪問可以保證一致性,且 NVLink 2.0 進一步支持了 CPU 和 GPU 之間的數(shù)據(jù)緩存一致性。

低延遲:相比于 PCIe,NVLink 的數(shù)據(jù)傳輸延遲更低,這意味著在高帶寬的同時,數(shù)據(jù)可以更快地傳輸?shù)侥繕嗽O(shè)備,有助于減少計算等待時間。

3. NVLink 如何滿足 GPU 的數(shù)據(jù)傳輸需求

NVLink 的主要目的是提升 GPU 和其他計算單元之間的數(shù)據(jù)傳輸效率,以滿足以下幾方面的需求:

3.1 多 GPU 計算中的數(shù)據(jù)共享需求

在深度學習和科學計算中,常常需要使用多個 GPU 來分擔計算負載。例如,在訓練一個深度神經(jīng)網(wǎng)絡(luò)時,大量的訓練數(shù)據(jù)會被分配到不同的 GPU 上進行處理。每個 GPU 在獨立計算梯度和參數(shù)更新時,都會需要與其他 GPU 交換計算結(jié)果。傳統(tǒng)的 PCIe 總線在多 GPU 系統(tǒng)中的數(shù)據(jù)交換中效率較低,限制了多個 GPU 的協(xié)作效率。NVLink 通過多鏈路高帶寬連接,能夠大大加速 GPU 之間的數(shù)據(jù)共享,減少等待時間,提升多 GPU 系統(tǒng)的計算效率。

3.2 CPU 和 GPU 之間的數(shù)據(jù)傳輸需求

傳統(tǒng)的計算系統(tǒng)中,CPU 通常通過 PCIe 總線與 GPU 通信,受限于 PCIe 帶寬,CPU 在數(shù)據(jù)準備或結(jié)果回傳階段常常成為瓶頸。NVLink 2.0 支持 CPU 與 GPU 之間的直接互聯(lián),并且引入了數(shù)據(jù)一致性協(xié)議,使得 CPU 可以更快地訪問 GPU 內(nèi)存中的數(shù)據(jù),且可以將數(shù)據(jù)直接緩存到 CPU 的緩存系統(tǒng)中,顯著提升 CPU 與 GPU 之間的數(shù)據(jù)交互性能。這對于需要頻繁 CPU-GPU 數(shù)據(jù)交互的應(yīng)用(例如數(shù)據(jù)預(yù)處理、模型控制)尤為重要。

3.3 高性能計算對低延遲通信的需求

對于諸如物理仿真、金融建模和分子動力學等高性能計算任務(wù)而言,延遲是一個關(guān)鍵因素。PCIe 總線的延遲在高頻次的數(shù)據(jù)交互中會累積并產(chǎn)生顯著影響,NVLink 通過優(yōu)化傳輸協(xié)議和采用更低的延遲設(shè)計,使得 GPU 之間、CPU 和 GPU 之間的通信更加快速,有助于減少計算任務(wù)中的延遲影響。

4. NVLink 的分層協(xié)議設(shè)計

NVLink 采用了分層協(xié)議設(shè)計,由物理層(PL)、數(shù)據(jù)鏈路層(DL)和傳輸層(TL)組成,各層的主要功能如下:

物理層(PL):物理層負責數(shù)據(jù)的物理傳輸,是實現(xiàn)高帶寬傳輸?shù)幕A(chǔ)。NVLink 物理層優(yōu)化了信號傳輸質(zhì)量,保證數(shù)據(jù)能夠在更高的帶寬下穩(wěn)定傳輸。

數(shù)據(jù)鏈路層(DL):數(shù)據(jù)鏈路層負責數(shù)據(jù)的分包和錯誤校驗,確保傳輸數(shù)據(jù)的完整性和可靠性。

傳輸層(TL):傳輸層負責管理數(shù)據(jù)的傳輸控制和流量管理,協(xié)調(diào)多個鏈路之間的數(shù)據(jù)流轉(zhuǎn),提高整體傳輸效率。

這種分層設(shè)計讓 NVLink 的各個功能模塊能夠?qū)W⒂谔囟ǖ臄?shù)據(jù)處理任務(wù),從而在保證高性能的同時提高傳輸?shù)目煽啃浴?/p>

5. NVLink 的技術(shù)演進與系統(tǒng)優(yōu)化

NVLink 技術(shù)從 1.0 到 2.0 不斷發(fā)展,帶來了更高的帶寬、更低的延遲和更強的擴展性。NVLink 2.0 的幾個關(guān)鍵改進包括:

帶寬增加:單鏈路帶寬從 20 Gbit/s 增加到 25 Gbit/s,支持的鏈路數(shù)量也從 4 條增加到 6 條,從而使整體雙向帶寬達到 300 Gbit/s。

CPU-GPU 數(shù)據(jù)一致性:NVLink 2.0 允許 CPU 直接訪問 GPU 內(nèi)存,且支持 CPU 和 GPU 之間的數(shù)據(jù)緩存一致性。這種改進使得 CPU 在訪問 GPU 數(shù)據(jù)時無需通過復(fù)雜的軟件機制進行緩存同步,極大提高了數(shù)據(jù)交互效率。

兼容性拓展:NVLink 2.0 兼容 IBM 的 Power9 CPU,使得 Power 系統(tǒng)可以直接通過 NVLink 連接 GPU,進一步提升了 CPU-GPU 的互操作性能。

6. NVLink 在實際應(yīng)用中的效果

NVLink 已經(jīng)在多個領(lǐng)域展現(xiàn)出其優(yōu)勢,以下列舉幾個典型的應(yīng)用場景:

深度學習訓練:在深度學習的分布式訓練中,多個 GPU 需要實時共享大量的數(shù)據(jù)。NVLink 提供的高帶寬和低延遲能夠使數(shù)據(jù)更快地在 GPU 之間傳遞,大大縮短訓練時間。

高性能計算(HPC):在科學仿真、天氣預(yù)報等需要高性能計算的領(lǐng)域,NVLink 的高速互聯(lián)技術(shù)使得多個 GPU 和 CPU 可以協(xié)同工作,從而加速計算過程。

數(shù)據(jù)中心應(yīng)用:在數(shù)據(jù)中心中,NVLink 可以在多 GPU 系統(tǒng)中提供高效的數(shù)據(jù)傳輸機制,提高數(shù)據(jù)處理效率,滿足高并發(fā)數(shù)據(jù)訪問需求。

7. NVLink 技術(shù)的發(fā)展趨勢

隨著計算需求的不斷提升,NVIDIA 也在不斷優(yōu)化 NVLink 技術(shù)。例如,未來版本的 NVLink 可能會進一步提升單鏈路帶寬,并增加鏈路數(shù)量,以滿足更大規(guī)模、多節(jié)點計算集群的需求。同時,NVIDIA 還可能與更多 CPU 廠商合作,使得 NVLink 技術(shù)能夠兼容更多的硬件平臺,從而進一步拓展其應(yīng)用范圍。

8. 總結(jié)

NVLink 是 NVIDIA 針對 GPU 加速計算需求開發(fā)的高速互連技術(shù),旨在解決傳統(tǒng) PCIe 總線帶來的數(shù)據(jù)傳輸瓶頸問題。通過提供更高的帶寬、更低的延遲以及數(shù)據(jù)一致性支持,NVLink 有效提升了多 GPU 系統(tǒng)的計算性能,滿足了深度學習、科學計算、高性能計算等領(lǐng)域的需求。同時,NVLink 技術(shù)的分層協(xié)議設(shè)計和持續(xù)改進,使其在未來的 GPU 計算系統(tǒng)中將繼續(xù)發(fā)揮重要作用。

歡迎加入交流群,備注姓名+崗位+公司。

英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜