加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 去掉DSP的LPO
    • 壓力給到了交換機(jī)
    • 為什么是新華三?
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

兼容批量LPO光模塊,憑什么是新華三交換機(jī)?

10/02 09:55
1365
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

盡可能減少數(shù)據(jù)傳輸所消耗的電力,以致于讓每一瓦特電力都用于AI計(jì)算。面對(duì)“算力的盡頭是電力”,這是AI時(shí)代每一位智算中心運(yùn)營(yíng)者的夢(mèng)想。

但要接近這一夢(mèng)想變得越來(lái)越難。當(dāng)前,AI應(yīng)用和大模型的飛速發(fā)展正推動(dòng)智算中心AI集群的規(guī)模和數(shù)據(jù)流量激增,帶動(dòng)智算網(wǎng)絡(luò)的能耗和成本節(jié)節(jié)攀升。尤其是網(wǎng)絡(luò)中的光模塊器件,由于帶寬和數(shù)量都將成倍提升,面臨的整體功耗問(wèn)題尤為突出。

在此背景下,為了給“實(shí)際計(jì)算騰出更多的電力”,一種新的光模塊技術(shù)——LPO(線性驅(qū)動(dòng)可插拔光模塊)脫穎而出。LPO采用線性直驅(qū)技術(shù),取消了傳統(tǒng)可拔插光模塊中的DSP或CDR芯片,從而可顯著降低光模塊的功耗、成本和時(shí)延。

盡管LPO優(yōu)勢(shì)明顯,但要實(shí)現(xiàn)規(guī)模部署,首先面臨著交換機(jī)與光模塊之間的互聯(lián)互通挑戰(zhàn)。

值得慶賀的是,在不久前舉行的IFOC 2024上,業(yè)界傳出了一則勁爆消息:新華三獨(dú)家受邀在現(xiàn)場(chǎng)展示了H3C S9827-128DH高密400G智算交換機(jī)與多家廠商的400G DSP&LPO模塊的互聯(lián)測(cè)試,結(jié)果顯示DSP和LPO的性能表現(xiàn)相近,驗(yàn)證了基于112G SerDes的LPO方案的市場(chǎng)可行性。

此次互聯(lián)測(cè)試背后有著怎樣的技術(shù)邏輯和門檻?為什么偏偏新華三能做到?我們來(lái)展開(kāi)講一講。

去掉DSP的LPO

眾所周知,光模塊在網(wǎng)絡(luò)連接中執(zhí)行光信號(hào)和電信號(hào)轉(zhuǎn)換的任務(wù),傳統(tǒng)可拔插光模塊主要由DSP(數(shù)字信號(hào)處理器)、TIA(跨阻抗放大器)、Driver(驅(qū)動(dòng)器)、LD(激光器)、PD(光電探測(cè)器)等部分組成。連接交換機(jī)后,信號(hào)發(fā)送的大致流程是:交換機(jī)ASIC SerDes將電信號(hào)通過(guò)PCB印刷電路板)驅(qū)動(dòng)到光模塊,光模塊中的DSP芯片接收電信號(hào)并執(zhí)行信號(hào)再生、信號(hào)均衡補(bǔ)償?shù)裙δ?,然后電信?hào)經(jīng)過(guò)Driver放大后由激光器轉(zhuǎn)換為光信號(hào)發(fā)射出去。

顯然,在傳統(tǒng)可拔插光模塊中,DSP是關(guān)鍵組件。由于信號(hào)通過(guò)PCB上的傳輸線時(shí)會(huì)發(fā)生損耗,且損耗會(huì)隨著數(shù)據(jù)速率和傳輸線長(zhǎng)度增加而增加,而DSP芯片的引入可緩解鏈路損耗和對(duì)抗信號(hào)失真。

但DSP芯片也有缺點(diǎn),大家都知道,凡是負(fù)責(zé)高速數(shù)字信號(hào)處理的芯片都很耗電且成本高昂。數(shù)據(jù)顯示,400G光模塊中典型的7nm DSP功耗占模塊功耗的50%。進(jìn)入AI時(shí)代,隨著AI集群規(guī)模不斷擴(kuò)張,光模塊在智算網(wǎng)絡(luò)中的整體功耗還會(huì)進(jìn)一步加劇。一方面,光模塊速率從100G、200G向400G、800G甚至1.6T演進(jìn),致使單個(gè)光模塊的功耗持續(xù)攀升。另一方面,由于智算網(wǎng)絡(luò)架構(gòu)更加扁平且無(wú)收斂,AI集群規(guī)模擴(kuò)張會(huì)引發(fā)對(duì)光模塊的數(shù)量需求急劇上漲。據(jù)計(jì)算,智算網(wǎng)絡(luò)所需的光模塊數(shù)量將相對(duì)GPU數(shù)量呈數(shù)倍增長(zhǎng)。

正因如此,LPO技術(shù)從2023年開(kāi)始受到業(yè)界廣泛關(guān)注。如上圖所示,LPO摒棄了傳統(tǒng)光模塊里的DSP,取而代之的是,將相關(guān)功能集成到交換機(jī)ASIC,并采用性能更優(yōu)、信號(hào)補(bǔ)償能力更強(qiáng)的TIA和Driver電芯片。這樣一來(lái),光模塊中只剩下線性模擬組件和光引擎部分,從而可顯著降低光模塊功耗、延遲、成本和尺寸。

壓力給到了交換機(jī)

顯而易見(jiàn),LPO方案將信號(hào)再生和數(shù)字信號(hào)補(bǔ)償功能轉(zhuǎn)移到交換機(jī)側(cè)后,主要依靠ASIC SerDes來(lái)整合端到端鏈路性能,自然對(duì)交換機(jī)的性能和兼容性提出了更高的要求。

首先,LPO光模塊去掉DSP后只剩下對(duì)抖動(dòng)、噪聲、干擾、衰減等更加敏感的線性模擬組件,盡管Driver/TIA具有更強(qiáng)的均衡能力,但仍然不可避免地會(huì)將這些影響信號(hào)完整性的因素層層傳遞和疊加,進(jìn)而造成整條鏈路的誤碼率增加。因此,這要求對(duì)交換機(jī)的電路部分進(jìn)行精心設(shè)計(jì),以實(shí)現(xiàn)更低的交換機(jī)端口損耗,確保到達(dá)光模塊的電信號(hào)質(zhì)量足夠好。

其次,交換機(jī)ASIC SerDes與光模塊之間通過(guò)PCB上的傳輸線路連接,受走線、打孔、焊接等PCB制造工藝的影響,交換機(jī)各個(gè)端口的插入損耗和回波損耗必然存在一定的差異,導(dǎo)致同一LPO光模塊在不同交換機(jī)端口的誤碼率性能表現(xiàn)不一致。這要求交換機(jī)能對(duì)高損耗端口進(jìn)行補(bǔ)償,并能根據(jù)不同端口的損耗匹配最優(yōu)的均衡參數(shù),從而確保交換機(jī)全端口支持LPO光模塊。

再者,由于采用的激光器方案、支持的傳輸距離等不同,LPO光模塊具有多種類型,考慮不同廠家、不同類型的LPO光模塊的光電通道特性不同,交換機(jī)還需具備識(shí)別光模塊類型的能力,并能根據(jù)不同的信道特性、TIA/Driver參數(shù)進(jìn)行均衡參數(shù)自動(dòng)調(diào)優(yōu),以主動(dòng)適配光模塊,使端到端鏈路性能達(dá)到最優(yōu)。

為什么是新華三?

本次互聯(lián)測(cè)試在H3C S9827-128DH與各廠商的多種類型的LPO光模塊之間完成了光眼圖測(cè)試和誤碼率測(cè)試,結(jié)果顯示:一、H3C S9827-128DH端口可以識(shí)別400G VR4+VCSEL、400G DR4+硅光、400G DR4+EML等不同類型、不同規(guī)格的QSFP112模塊,同時(shí)交換機(jī)不同端口保持較好的電信號(hào)一致性;二、各廠商的LPO模塊在H3C S9827上的誤碼率均低于門限要求,且經(jīng)過(guò)與主機(jī)適配調(diào)優(yōu)的LPO模塊誤碼率表現(xiàn)較好,與DSP方案光模塊誤碼率相近。

這些良好的測(cè)試結(jié)果無(wú)疑證明了新華三智算交換機(jī)已解決LPO方案帶給交換機(jī)的新挑戰(zhàn),彰顯出新華三智算交換機(jī)產(chǎn)品強(qiáng)大的性能、穩(wěn)定性和兼容性,為L(zhǎng)PO光模塊規(guī)模應(yīng)用再添助力。這背后,新華三是如何做到的?

首先,為確保交換機(jī)全端口性能一致良好,新華三 S9827-128DH采用51.2T交換芯片、以及領(lǐng)先的超低損PCB板材,并精密設(shè)計(jì)端口與PCB板材之間的布局走線,最大化減少電信號(hào)衰減和串聲干擾。同時(shí),經(jīng)過(guò)長(zhǎng)達(dá)半年的反復(fù)測(cè)試、修改、優(yōu)化交換機(jī)驅(qū)動(dòng)軟件和高速模塊寄存器中的高速電信號(hào)參數(shù)(預(yù)加重、均衡等),選取最優(yōu)的參數(shù)模型,導(dǎo)入交換機(jī)的固化軟件系統(tǒng)中。在模塊上電后,將自動(dòng)識(shí)別高速模塊并賦予其兼容范圍最好的電信號(hào),實(shí)現(xiàn)較低的誤碼率,保障業(yè)務(wù)端口穩(wěn)定運(yùn)行。

其次,為了廣泛兼容不同規(guī)格、不同技術(shù)方案的高速模塊,H3C S9827-128DH交換機(jī)軟件遵循CMIS和SFF-8636,采用邏輯讀取器,在讀取光模塊寄存器中的信息后,通過(guò)在驅(qū)動(dòng)軟件導(dǎo)入的靈活、完善的識(shí)別策略,實(shí)現(xiàn)對(duì)各廠家的不同模塊規(guī)格(VR4、DR4等)、不同芯片方案(DSP、LPO)、不同激光器方案(EML、硅光)、多種應(yīng)用模式(一對(duì)一、一分二)的QSFP112模塊的類型讀取,可靈活智能識(shí)別端口模塊模式,快速上電。

最后,謀全局,方能引領(lǐng)變革。以上所有的技術(shù)創(chuàng)新突破當(dāng)然都離不開(kāi)新華三的前瞻性布局。面對(duì)日新月異的AI技術(shù)和應(yīng)用推動(dòng)智算中心的異構(gòu)算力規(guī)模和復(fù)雜性節(jié)節(jié)攀升,給智算網(wǎng)絡(luò)的性能、能效等提出了越來(lái)越高的要求,新華三始終倡導(dǎo)以開(kāi)放標(biāo)準(zhǔn)的聯(lián)接技術(shù)打通智算互聯(lián)互通的大動(dòng)脈。光模塊作為智算網(wǎng)絡(luò)的關(guān)鍵器件,此次新華三智算交換機(jī)完成與各廠商、各種類型的LPO光模塊的良好對(duì)接,正是踐行開(kāi)放標(biāo)準(zhǔn)路線的一次生動(dòng)實(shí)踐。

事實(shí)上,在前瞻性布局引領(lǐng)下,新華三不只是推出了400G/800G LPO高密智算交換機(jī),還推出了支持同城長(zhǎng)距集群間的互聯(lián)互通的400G/800G ZR/ZR+ DCI硬件方案、具有極致的轉(zhuǎn)發(fā)性能與網(wǎng)卡解耦能力的算力集群核心交換機(jī)H3C S12500 AI等眾多產(chǎn)品與解決方案,充分表明其已在AI算力時(shí)代把握住了先發(fā)優(yōu)勢(shì),為推動(dòng)智算網(wǎng)絡(luò)變革和助力AI產(chǎn)業(yè)綠色高效發(fā)展做好了充分準(zhǔn)備。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜