加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 電源設(shè)計挑戰(zhàn)
    • 數(shù)字控制與模擬控制解決方案
    • 功率級:集成是關(guān)鍵
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

下一代尖端AI系統(tǒng)的電源解決方案

01/22 09:17
3840
閱讀需 6 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

備注:此文章來源于MPS官方出品。

人工智能AI)綜合了多種解決問題的方法,例如數(shù)學(xué)、計算統(tǒng)計、機(jī)器學(xué)習(xí)和預(yù)測分析。AI系統(tǒng)通過基于計算機(jī)的“神經(jīng)”網(wǎng)絡(luò)來模仿人腦學(xué)習(xí)并解決問題。這種神經(jīng)網(wǎng)絡(luò)并行處理器組成,能夠運行復(fù)雜的學(xué)習(xí)任務(wù)并執(zhí)行軟件算法。如今的AI還在改革計算架構(gòu),以復(fù)制模仿人腦的神經(jīng)網(wǎng)絡(luò)。盡管在具有傳統(tǒng)中央處理器CPU)的服務(wù)器上也可以訓(xùn)練或開發(fā)通用模型,但大多數(shù)神經(jīng)網(wǎng)絡(luò)都需要自定義的內(nèi)置硬件來進(jìn)行訓(xùn)練。

圖形處理單元(GPU)和張量處理單元(TPU)是用于加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的常見加速器。它們可以處理重復(fù)性和密集型計算,但卻異常耗電。例如,早期的AI市場主導(dǎo)者英偉達(dá)的DGX-1 GPU超級計算機(jī)內(nèi)置8個Tesla P100 GPU,每個GPU算力達(dá)到21.2 TeraFLOP,總共需要3200W的系統(tǒng)總功率。最新一代的DGX-2超級計算機(jī)則內(nèi)置16個Tesla V100 GPU,每個GPU算力達(dá)2 petaFLOP,所需系統(tǒng)總功率達(dá)到10kW。因此,AI市場將迅速增長以滿足不斷增長的電源需求也就不足為奇了。

電源設(shè)計挑戰(zhàn)

AI電源系統(tǒng)設(shè)計人員面臨多方面的挑戰(zhàn)。提供千瓦功率是他們的第一個挑戰(zhàn),而且效率絕對至關(guān)重要。要知道,這些計算系統(tǒng)是以全功率運行的復(fù)雜負(fù)載。活躍度下降,功率需求也會隨之下降。系統(tǒng)必須在整個電力需求中保持盡可能高的效率。浪費的每一瓦能量都會作為熱量消散,并轉(zhuǎn)化為數(shù)據(jù)中心對散熱系統(tǒng)的更高要求,這會增加運營成本以及碳足跡。

空間成本也在不斷上升。現(xiàn)代數(shù)據(jù)中心都包含成百上千個處理單元,因此設(shè)備大小非常重要。減小單個單元的尺寸,就可以在與大型解決方案相同的空間中應(yīng)用更多設(shè)備,從而實現(xiàn)更高的處理能力密度。然而,越小的尺寸越要求極大地提高功率密度,并減小散熱面積。這使得散熱管理成為下一代尖端CPU、GPU和TPU電源設(shè)計面臨的重大挑戰(zhàn)之一。

另外,系統(tǒng)復(fù)雜性的增加和設(shè)計周期的壓縮使設(shè)計資源更加緊張。資源大部分被分配給系統(tǒng)關(guān)鍵知識產(chǎn)權(quán)的開發(fā),這意味著電源方案相關(guān)的電路常常被忽略,直到開發(fā)周期的后期。實際上,我們只需很少的時間,并且可能只需很少的電源設(shè)計資源就可以解決上述的挑戰(zhàn),得到理想的整體電源解決方案,它將是節(jié)省空間的、高效的、可擴(kuò)展的、靈活的,并且只需要很少的設(shè)計工作。

數(shù)字控制與模擬控制解決方案

模擬控制解決方案現(xiàn)在已無法應(yīng)對AI市場中快速增長的電源需求?,F(xiàn)在的電源系統(tǒng)更加智能,它被集成到整體解決方案中,與主CPU/GPU/TPU之間的通信也成為一項設(shè)計要求。在為AI市場設(shè)計高端電源解決方案時,數(shù)字控制解決方案將占據(jù)主導(dǎo)。

理想的控制解決方案應(yīng)當(dāng)兼容多種產(chǎn)品(例如Intel、AMD、PMBus),并且因可擴(kuò)展且配置靈活而易于使用。包括MPS在內(nèi)的很多公司都提供了這類理想的高級控制器(參見表1)。它們提供了廣泛而準(zhǔn)確的系統(tǒng)控制,同時提供詳細(xì)而精確的監(jiān)測。電壓、電流、頻率和故障監(jiān)測均可在寬范圍內(nèi)進(jìn)行配置。工程師可以實時訪問這些監(jiān)測值,以全面了解解決方案的性能。有經(jīng)驗的工程師還可以通過預(yù)測分析來優(yōu)化運行時間,并在需要維修時獲取更多可用數(shù)據(jù),從而最大程度地縮短停機(jī)時間。

MPS高級控制器解決方案 其他模擬控制器解決方案 其他數(shù)字控制器解決方案
通信協(xié)議
  • PMBUS(帶或不帶AVS)
  • SVID
  • SVI2
  • I2C
  • PWM-VID
  • SVID
  • SVI2
  • I2C
  • PWM-VID
  • PMBUS(帶或不帶AVS)
  • SVID
  • SVI2
  • I2C
最大相位配置
  • 雙軌或單軌,具有靈活的相位分配
  • 10相或以下
  • 雙軌或單軌
  • 7相或以下
  • 雙軌或單軌,具有靈活的相位分配
  • 8相或以下
封裝 5mmx5mm QFN封裝或更小尺寸 7mmx7mm QFN封裝或更小尺寸 7mmx7mm QFN封裝或更小尺寸

表1:高級控制器vs.模擬和數(shù)字控制解決方案

功率級:集成是關(guān)鍵

顯而易見,電源解決方案沒有功率級就無法工作,而功率級通常會采用分立式解決方案。 分立式解決方案由驅(qū)動器IC和一對外部MOSFET組成,為三芯片解決方案。還有一種方法是將多芯片驅(qū)動器-MOSFET(DrMOS)共同封裝到一個IC解決方案中。如前所述,不斷縮小的系統(tǒng)板面積使三芯片解決方案變得不再理想,因為它增加了有限板空間中的組件數(shù)量。共同封裝的多芯片解決方案體積更小,所需的組件也更少;不過,其封裝內(nèi)部的寄生電感仍然很高,這會導(dǎo)致效率的損失,對AI等大功率應(yīng)用而言也不理想。

MPS

MPS

美國芯源系統(tǒng)有限公司(MPS)是一家全球知名的高性能模擬半導(dǎo)體公司,總部位于美國加州圣荷塞。公司創(chuàng)建于1997年,具有三大核心競爭優(yōu)勢:多年來的系統(tǒng)和應(yīng)用級技術(shù)積累、一流的模擬集成電路設(shè)計能力以及自主創(chuàng)新的工藝技術(shù),這些核心競爭力使公司能夠生產(chǎn)出高度集成的單晶片產(chǎn)品,為客戶提供高效率、低成本的解決方案。

美國芯源系統(tǒng)有限公司(MPS)是一家全球知名的高性能模擬半導(dǎo)體公司,總部位于美國加州圣荷塞。公司創(chuàng)建于1997年,具有三大核心競爭優(yōu)勢:多年來的系統(tǒng)和應(yīng)用級技術(shù)積累、一流的模擬集成電路設(shè)計能力以及自主創(chuàng)新的工藝技術(shù),這些核心競爭力使公司能夠生產(chǎn)出高度集成的單晶片產(chǎn)品,為客戶提供高效率、低成本的解決方案。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜