英特爾在用于高速數(shù)據(jù)傳輸的硅光集成技術(shù)上取得了突破性進展。在2024年光纖通信大會(OFC)上,英特爾硅光集成解決方案(IPS)團隊展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學計算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運行真實數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用,英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實現(xiàn)了光學I/O(輸入/輸出)共封裝,從而推動了高帶寬互連技術(shù)創(chuàng)新。
英特爾硅光集成解決方案團隊產(chǎn)品管理與戰(zhàn)略高級總監(jiān)Thomas Liljeberg表示:“服務(wù)器之間的數(shù)據(jù)傳輸正在不斷增加,當今的數(shù)據(jù)中心基礎(chǔ)設(shè)施難堪重負。目前的解決方案正在迅速接近電氣I/O性能的實際極限。然而,借助英特爾的這項突破性進展,客戶能夠?qū)⒐韫夤卜饣ミB方案無縫集成到下一代計算系統(tǒng)中。英特爾的OCI芯粒大大提高了帶寬、降低了功耗并延長了傳輸距離,有助于加速機器學習工作負載,進而推動高性能AI基礎(chǔ)設(shè)施創(chuàng)新?!?/p>
該OCI芯??稍谠谧铋L可達100米的光纖上,單向支持64個32Gbps 通道,有望滿足AI基礎(chǔ)設(shè)施日益增長的對更高帶寬、更低功耗和更長傳輸距離的需求。它將有助于實現(xiàn)可擴展的CPU和GPU集群連接,和包括一致性內(nèi)存擴展及資源解聚的新型計算架構(gòu)。
AI應(yīng)用正在全球范圍內(nèi)被越來越多地部署,近期大語言模型和生成式AI的發(fā)展正在加速這一趨勢。對AI負載加速新需求而言,更大、更高效的機器學習模型將發(fā)揮關(guān)鍵作用。未來的計算平臺需要面向AI實現(xiàn)擴展,因而需要指數(shù)級提升的I/O帶寬和更長的傳輸距離,以支持更大規(guī)模的處理器(CPU、GPU和IPU)集群,和資源利用更高效的架構(gòu),如xPU解聚和內(nèi)存池化(memory pooling)。
電氣I/O(即銅跡線連接)帶寬密度高且功耗低,但傳輸距離短至不超一米。數(shù)據(jù)中心和早期AI集群中使用的可插拔光收發(fā)器模塊可以延長傳輸距離,但就AI工作負載的擴展需求而言,其成本和功耗不可持續(xù)。xPU光電共封I/O解決方案 可以在提高能效比、降低延遲和延長傳輸距離的同時,支持更高的帶寬,從而滿足AI和機器學習基礎(chǔ)設(shè)施的擴展需求。
打個比方,在CPU和GPU中,用光學I/O取代電氣I/O進行數(shù)據(jù)傳輸,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數(shù)量更大、距離更遠)。英特爾的OCI芯粒等光學 I/O 解決方案,在性能和能耗方面實現(xiàn)了這一水平的提升,從而有助于AI的擴展。
英特爾OCI(光學計算互連)芯粒
在完全集成的OCI芯粒中,英特爾利用了已實際驗證的硅光子技術(shù),集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。在2024年光纖通信大會上,英特爾展示了與自家CPU封裝在一起的OCI芯粒,但它也能與下一代CPU、GPU、IPU等SOC(系統(tǒng)級芯片)集成。
這一完全集成的OCI芯粒的雙向數(shù)據(jù)傳輸速度達4 Tbps,并兼容第五代PCIe。在2024年光纖通信大會現(xiàn)場,實時光學鏈路演示展示了通過單模光纖(SMF)跳線(patch cord)在兩個CPU平臺之間實現(xiàn)的發(fā)射器(Tx)和接收器(Rx)互連。CPU生成并測量了比特誤碼率(BER)。英特爾還展示了發(fā)射器的光譜(optical spectrum),包括單一光纖上200GHz間隔的八個波長,以及32Gbps發(fā)射器眼圖(eye diagram),表明信號質(zhì)量很強。
該芯粒目前單向支持64個32Gbps 通道,傳輸距離達100米(由于傳輸延遲,實際應(yīng)用中距離可能僅限幾十米)。它采用8對光纖,每根8波長密集波分復(fù)用(DWDM)。這種共封裝解決方案也非常節(jié)能,功耗僅為每比特5皮焦耳(pJ),而可插拔光收發(fā)器模塊的功耗大約為每比特15皮焦耳。對數(shù)據(jù)中心和HPC環(huán)境而言,超高的能效十分重要,有助于解決AI應(yīng)用的高能耗問題,提高可持續(xù)性。
英特爾研究院在硅光子領(lǐng)域已深耕超過25年,是硅光集成的開拓者和領(lǐng)導(dǎo)者。英特爾在業(yè)內(nèi)率先開發(fā)并向大型云服務(wù)提供商批量交付硅光子連接器件,這些產(chǎn)品具有領(lǐng)先的可靠性。
英特爾的主要差異化優(yōu)勢在于其直接集成技術(shù),結(jié)合晶圓上激光器混合集成技術(shù),可提高良率并降低成本。這一獨特的方法使英特爾能夠在實現(xiàn)卓越性能的同時保持高能效比。依托強大的量產(chǎn)平臺,英特爾已出貨超過800萬個硅光子集成電路,包含多達3200萬個片上集成激光器,時基故障率(FIT)小于0.1。時基故障率是一種廣泛使用的測量可靠性的方法,體現(xiàn)了故障率和發(fā)生故障的次數(shù)。
這些硅光子集成電路被封裝在可插拔收發(fā)器模塊中,部署于超大規(guī)模云服務(wù)提供商的大型數(shù)據(jù)中心網(wǎng)絡(luò)中,用于傳輸速率需求高達100、200和400 Gbps的應(yīng)用。面向傳輸速率需求達800 Gbps和1.6 Tbps的新興應(yīng)用,速度達200G/通道的硅光子集成電路正在開發(fā)中。
英特爾還正在探索新的硅光子制造工藝節(jié)點,該節(jié)點具有先進的器件性能、更高的密度、更好的耦合性,并能大幅提高經(jīng)濟性。英特爾將繼續(xù)在片上激光器和性能、成本(芯片面積減少 40% 以上)和功耗(減少 15% 以上)等方面取得進步。
英特爾研發(fā)的OCI芯粒目前尚處于技術(shù)原型(prototype)階段。英特爾正在與客戶合作,開發(fā)共封OCI和客戶SoC,作為光學I/O的解決方案。
英特爾的OCI芯粒推動了高速數(shù)據(jù)傳輸技術(shù)的進步。隨著AI基礎(chǔ)設(shè)施的不斷發(fā)展,英特爾將繼續(xù)推動前沿技術(shù)創(chuàng)新,探索面向未來的連接技術(shù)。