加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 算法仿真的本質(zhì)
    • 算法仿真的四大特性
    • 一種動(dòng)態(tài)思路:增加時(shí)間維度
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

芯片設(shè)計(jì)五部曲之三 | 戰(zhàn)略規(guī)劃家——算法仿真

09/04 10:02
996
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

芯片設(shè)計(jì)五部曲》:模擬IC、數(shù)字IC、算法仿真、存儲(chǔ)芯片和總結(jié)篇(排名不分先后

芯片設(shè)計(jì)五部曲之一| 聲光魔法師——模擬IC

芯片設(shè)計(jì)五部曲之二 |? 圖靈藝術(shù)家——數(shù)字IC

上兩集我們已經(jīng)分別深入了模擬IC和數(shù)字IC的設(shè)計(jì)全流程,結(jié)合EDA工具特性和原理,講述怎么利用計(jì)算機(jī)技術(shù)提高模擬與數(shù)字芯片的研發(fā)設(shè)計(jì)效率。這一集,我們把其中的算法仿真部分拉出來(lái)展開(kāi)說(shuō)說(shuō)。

第三集:算法仿真

算法是對(duì)芯片系統(tǒng)進(jìn)行的整體戰(zhàn)略規(guī)劃,決定了芯片各個(gè)模塊功能定義及實(shí)現(xiàn)方式,指引著整個(gè)芯片設(shè)計(jì)的目標(biāo)和方向??芍^,牽一發(fā)而動(dòng)全身。不管是模擬IC還是數(shù)字IC設(shè)計(jì),算法仿真都是第一步。通常,會(huì)由算法工程師組成獨(dú)立的算法團(tuán)隊(duì)。

CPU/GPU本應(yīng)該是算法仿真的???,但因?yàn)闅v史比較悠久,發(fā)展成熟,市場(chǎng)幾乎被英偉達(dá)AMD壟斷,很多IC設(shè)計(jì)公司選擇直接采購(gòu)IP的方式跳過(guò)這一步。

近幾年,無(wú)線通信芯片成為了算法業(yè)務(wù)的最大甲方。因?yàn)檫@類(lèi)芯片的信號(hào)編解碼與頻譜遷移時(shí)方式十分復(fù)雜,再加上種類(lèi)繁多,各國(guó)的通信協(xié)議、標(biāo)準(zhǔn)、頻率也在不斷變化。隨著我國(guó)5G通信標(biāo)準(zhǔn)的放開(kāi),算法仿真的地位與日俱進(jìn)。

另一個(gè)涉及大量算法業(yè)務(wù)的場(chǎng)景是AI芯片,應(yīng)用場(chǎng)景小到手機(jī)、智能家電,大至汽車(chē)。

跟前兩篇數(shù)字和模擬IC的設(shè)計(jì)場(chǎng)景相比,算法仿真有著非常不一樣的表現(xiàn)。

所以我們單獨(dú)把ta拉出來(lái),結(jié)合一家無(wú)線通信芯片公司實(shí)際業(yè)務(wù)場(chǎng)景,看看算法仿真有哪四大特性,以及從動(dòng)態(tài)視角出發(fā),看我們?cè)趺磶退惴üこ處熃鉀Q問(wèn)題,提高研發(fā)效率。

算法仿真的本質(zhì)

算法(Algorithm),是指在數(shù)學(xué)和計(jì)算機(jī)科學(xué)間,一種被定義好的、計(jì)算機(jī)可施行指示的步驟和次序。算法代表著用系統(tǒng)的方法描述解決問(wèn)題的策略機(jī)制,解決一個(gè)問(wèn)題可以有很多種算法。

舉個(gè)栗子。

求解下圖黃色區(qū)域圖形面積,我們有三種算法。

方法一:你可以直接用三角形的面積公式解。這種方法快速、直觀,小學(xué)文化程度即可,但局限性也高、不通用,不適用于圖像復(fù)雜的情況;

方法二:也可以用符號(hào)計(jì)算求不定積分。求解析解方法,適用于各類(lèi)不定積分中有解析表達(dá)式的函數(shù)圖像。計(jì)算門(mén)檻較高,大多手算,很少有計(jì)算工具。而且實(shí)際工程應(yīng)用場(chǎng)景中,很多函數(shù)沒(méi)有解析解;

方法三:用數(shù)值計(jì)算方式解積分,求數(shù)值解。數(shù)值計(jì)算法適用范圍最廣,可以求任意函數(shù)曲線的定積分,將函數(shù)一段段分解,再算出面積。不同的分解方法就代表不同的算法。這種方法只能求數(shù)值解,無(wú)法求解析解,且計(jì)算量巨大,適合機(jī)器計(jì)算,不適合人工計(jì)算,在工程領(lǐng)域應(yīng)用甚廣。

在芯片設(shè)計(jì)領(lǐng)域,算法仿真的本質(zhì)是評(píng)估不同數(shù)值計(jì)算解法的工作量、計(jì)算效率適用范圍,選出最優(yōu)算法,使ta不僅要滿足算得最快、最準(zhǔn),還要能確保功能、精度、效率、吞吐量等指標(biāo)。

算法仿真是一個(gè)不斷迭代、優(yōu)化的過(guò)程,一般都要反復(fù)調(diào)整參數(shù),進(jìn)行N次回歸測(cè)試。

一家算法團(tuán)隊(duì)的小目標(biāo)

一家無(wú)線通信芯片公司算法團(tuán)隊(duì),開(kāi)局情況如下:算法部門(mén)共有15人,全公司有480核共享本地資源,各部門(mén)按需提前申請(qǐng)使用。根據(jù)公司的業(yè)務(wù)發(fā)展目標(biāo),大致估算出未來(lái)新算法項(xiàng)目任務(wù)總數(shù)為1283980。

假設(shè)一:全公司本地資源均歸他們用,每個(gè)人的資源上限是32核;假設(shè)二:?jiǎn)蝐ase運(yùn)行時(shí)間為10小時(shí);

假設(shè)三:回歸測(cè)試次數(shù)為1次;假設(shè)四:1個(gè)case只有1個(gè)job,且只用1個(gè)核。

總運(yùn)行時(shí)間達(dá)到3.05年。

啊這。??赡艽蜷_(kāi)方式不對(duì),再來(lái):增加假設(shè)五:人均資源上限逐漸提升到120核;

假設(shè)六:算法團(tuán)隊(duì)人數(shù)逐步擴(kuò)張至46人;

總運(yùn)行時(shí)間約96.92天。嗯,這回挺好。

想得是挺美,小目標(biāo)怎么實(shí)現(xiàn)?

現(xiàn)實(shí)一:公司共享本地資源不可能只歸算法部門(mén)專(zhuān)用;

現(xiàn)實(shí)二:?jiǎn)蝐ase運(yùn)行時(shí)間,難以估計(jì);且1個(gè)case往往不止1個(gè)job,且1個(gè)job未必只用1個(gè)核;

現(xiàn)實(shí)三:回歸測(cè)試只有1次,幾乎不太可能,總?cè)蝿?wù)數(shù)可能數(shù)倍增長(zhǎng);

現(xiàn)實(shí)四:本地機(jī)房從480核要擴(kuò)張十幾倍,可不止是買(mǎi)買(mǎi)買(mǎi)硬件,機(jī)房建設(shè)、運(yùn)維人力、硬件維保、存儲(chǔ)網(wǎng)絡(luò)、環(huán)境部署等等,都不是小事;

現(xiàn)實(shí)五:算法工程師要求非常高,招聘難度極大。

真是,沒(méi)一個(gè)字讓人愛(ài)聽(tīng)的。

如果是日常模擬/數(shù)字芯片設(shè)計(jì),想做算力規(guī)劃,咱們還是有思路的,可以看看這篇:解密一顆芯片設(shè)計(jì)的全生命周期算力需求

但算法仿真這里,此路不通。

我們來(lái)看看算法仿真的特性:

算法仿真的四大特性

下圖是這家無(wú)線通信芯片公司算法團(tuán)隊(duì)9個(gè)月實(shí)際日平均資源用量波動(dòng)總覽圖:

01需求不可測(cè)

從個(gè)人角度出發(fā),算法團(tuán)隊(duì)每個(gè)人的算法任務(wù)都是互相獨(dú)立,互不影響的。算法確定之后,每一輪的計(jì)算量基本確定(case分解成的job數(shù),job占用的核數(shù)基本確定),每個(gè)算法任務(wù)的單次耗時(shí)與回歸測(cè)試次數(shù)都是不一樣的,這導(dǎo)致最后的資源需求完全不可測(cè)。

如果再疊加團(tuán)隊(duì)使用因素,資源的不可測(cè)性也會(huì)被成倍地放大。如果原先個(gè)人的資源使用區(qū)間是0到250核小時(shí);如果團(tuán)隊(duì)內(nèi)有20人,那不可測(cè)區(qū)間就放大至0至5000核小時(shí)。

02短時(shí)間使用量波動(dòng)巨大

除了算法任務(wù)需求的不可測(cè)性,資源使用量的波動(dòng)還受實(shí)際算法任務(wù)的進(jìn)度影響。

每個(gè)算法工程師的工作獨(dú)立且進(jìn)度不一,有時(shí)可能大量任務(wù)同時(shí)批量運(yùn)行,也可能部分在調(diào)試,部分在運(yùn)行,甚至可能一個(gè)在運(yùn)行的任務(wù)都沒(méi)有。

不同工程師的工作進(jìn)度差異與所用算法不一,不僅導(dǎo)致了波峰、波谷間的資源使用量差距極大,而且這樣的波動(dòng)可能發(fā)生在極短時(shí)間內(nèi)。

極限情況:所有工程師都在頂格跑任務(wù),5520核的資源量瞬間拉滿(100%);而下一刻只有10%的工程師在跑任務(wù),且每人都只使用自己配額80%的資源量,那總資源僅使用了一部分。

不同公司的算法團(tuán)隊(duì)之間,因?yàn)閳F(tuán)隊(duì)規(guī)模與業(yè)務(wù)差異,資源用量差異也非常大。

03資源需求類(lèi)型多樣

算法仿真整體來(lái)說(shuō),對(duì)資源的各方面需求并不算高。

但不同算法的需求都不一樣:

有的需要單核4G內(nèi)存的機(jī)型,有的要單核8G內(nèi)存的機(jī)型;

有的算法對(duì)存儲(chǔ)要求高,有的算法對(duì)存儲(chǔ)沒(méi)要求:

有的涉及圖形計(jì)算,甚至還需要用到GPU機(jī)型。

04長(zhǎng)期可持續(xù)狀態(tài)

上述三大特性,都不是突發(fā)現(xiàn)象,屬于算法團(tuán)隊(duì)的日常工作狀態(tài)。

這一狀態(tài)的長(zhǎng)期可持續(xù)性,我們需要對(duì)此做好足夠的準(zhǔn)備。

一種動(dòng)態(tài)思路:增加時(shí)間維度

算法仿真的四大特性決定了:按這家公司原來(lái)的靜態(tài)處理方式,也就是把任務(wù)量當(dāng)成恒定的,通過(guò)加人加機(jī)器的方式來(lái)滿足研發(fā)需求,變得很不現(xiàn)實(shí)。哪怕頂格準(zhǔn)備資源,資源利用率也會(huì)長(zhǎng)期處于較低狀態(tài)。

那按動(dòng)態(tài)處理方式,也就是隨著時(shí)間變化,靈活根據(jù)需求匹配不同規(guī)模/類(lèi)型資源的方式來(lái)動(dòng)態(tài)滿足研發(fā)需求,從個(gè)人及團(tuán)隊(duì)視角出發(fā),看我們?cè)趺磶退惴üこ處熃鉀Q問(wèn)題,提高研發(fā)效率。

01算法工程師視角

1)資源無(wú)需申請(qǐng),即開(kāi)即用

再也不用跟同事?lián)屬Y源或者漫長(zhǎng)的排隊(duì)等待了,也不用走繁瑣的資源申請(qǐng)流程。

2)資源選擇空間變大

選擇空間變大,資源類(lèi)型變多,可用資源上限變高,可以靈活選擇更加適配算法任務(wù)的資源類(lèi)型。

給大家打個(gè)樣:5000核大規(guī)模OPC上云,效率提升53倍

3)提交任務(wù)立馬就能跑,告別等待

提交任務(wù)立馬就能跑,一整套研發(fā)環(huán)境現(xiàn)成的,即開(kāi)即用。靈活切換,今天跑一百,明天跑一萬(wàn),無(wú)需等待環(huán)境配置。

4)以前怎么用,現(xiàn)在就怎么用

跟本地相比無(wú)感知,用戶使用習(xí)慣沒(méi)有任何改變,不需要調(diào)整任何腳本。

5)任務(wù)跑得快,效率線性增長(zhǎng)

多case高并發(fā)執(zhí)行。同一批算法任務(wù)之間互相獨(dú)立,可以做到效率線性提升。

02團(tuán)隊(duì)管理視角

1)動(dòng)態(tài)方式解決資源不可測(cè)問(wèn)

題算法任務(wù)的不可預(yù)測(cè)且波動(dòng)巨大,導(dǎo)致了資源預(yù)測(cè)與規(guī)劃基本不可能。

按傳統(tǒng)靜態(tài)處理方式來(lái)解決問(wèn)題:

按頂格規(guī)劃,這筆賬都不用算,會(huì)造成黃色區(qū)域的巨大浪費(fèi);

按中間取值準(zhǔn)備,當(dāng)某個(gè)時(shí)間點(diǎn)算法仿真短時(shí)間內(nèi)任務(wù)量激增,就會(huì)出現(xiàn)人機(jī)不匹配,不是有人力沒(méi)機(jī)器,就是有機(jī)器沒(méi)人力。這種錯(cuò)配導(dǎo)致資源利用率極低,影響研發(fā)進(jìn)度。

圖中3-5月,峰值算力就從200核攀升27倍達(dá)到5520核,隨即又迅速?gòu)?520核下跌到500核左右,這波動(dòng)幅度簡(jiǎn)直比過(guò)山車(chē)還劇烈,而且毫無(wú)規(guī)律。

我們的動(dòng)態(tài)處理方式,會(huì)隨著時(shí)間變化,靈活根據(jù)當(dāng)前時(shí)間點(diǎn)任務(wù)需求匹配不同規(guī)模/類(lèi)型資源的方式,動(dòng)態(tài)滿足研發(fā)需求。

不管500核還是5000核,我們都能實(shí)時(shí)根據(jù)需要,滿足整個(gè)團(tuán)隊(duì)的大幅波動(dòng)資源需求,保障日常算力和峰值算力任務(wù)調(diào)度效率。

2)Auto-Scale自動(dòng)伸縮,隨用隨關(guān)不浪費(fèi)?

Fsched調(diào)度器的Auto-Scale功能,能解決團(tuán)隊(duì)資源利用率與成本問(wèn)題。資源“自由”的同時(shí)不浪費(fèi)。

一方面隨用戶任務(wù)需求,設(shè)置自動(dòng)伸縮上下限,自動(dòng)化調(diào)用資源完成任務(wù);

Auto-Scale功能可以根據(jù)任務(wù)運(yùn)算情況動(dòng)態(tài)開(kāi)啟云端資源,需要多少開(kāi)多少,并在任務(wù)完成后自動(dòng)關(guān)閉,讓資源的使用緊隨著用戶的需求自動(dòng)擴(kuò)張及縮小,最大程度匹配任務(wù)需求。

這既節(jié)約了用戶成本,不需要時(shí)刻保持開(kāi)機(jī),也最大限度保證了任務(wù)最大效率運(yùn)行。中間也不需要用戶干預(yù),手動(dòng)操作。

另一方面我們還能監(jiān)控用戶提交的任務(wù)數(shù)量和資源需求,在團(tuán)隊(duì)內(nèi)部進(jìn)行資源及時(shí)適配,解決錯(cuò)配問(wèn)題。

想了解更多關(guān)于Auto-Scale的內(nèi)容,點(diǎn)擊:EDA云實(shí)證Vol.10:Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?

3)提升團(tuán)隊(duì)整體運(yùn)營(yíng)效率

我們的運(yùn)營(yíng)數(shù)據(jù)dashboard能讓團(tuán)隊(duì)管理者監(jiān)控各個(gè)重要指標(biāo)變化,從全局角度掌握項(xiàng)目的整體任務(wù)及資源情況,為未來(lái)項(xiàng)目合理規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。

還能根據(jù)不同成員或小組的業(yè)務(wù)緊迫程度和業(yè)務(wù)重要性,合理分配與控制用戶使用資源。

4)全球數(shù)據(jù)中心解決資源瓶頸

我們的全球數(shù)據(jù)中心,能持續(xù)穩(wěn)定地提供用戶所需資源類(lèi)型及數(shù)量,分鐘級(jí)調(diào)度開(kāi)啟上萬(wàn)核計(jì)算資源,滿足業(yè)務(wù)緊迫度。

用戶可以選擇自主選擇大內(nèi)存、高主頻等多樣化的資源類(lèi)型來(lái)滿足不同算法需求。一旦發(fā)現(xiàn)所選資源類(lèi)型與算法任務(wù)不匹配,還可隨時(shí)中止任務(wù)、更換資源類(lèi)型,任務(wù)進(jìn)度不受影響。

附加題環(huán)節(jié):

對(duì)研發(fā)來(lái)說(shuō),能不能清晰看到任務(wù)的運(yùn)行狀態(tài)?實(shí)時(shí)監(jiān)測(cè)進(jìn)度?

任務(wù)異常時(shí)能不能自動(dòng)告警?對(duì)IT來(lái)說(shuō),資源用量如何?怎么判斷用戶資源使用量是否符合分配模式?系統(tǒng)負(fù)載過(guò)高是否有直接的告警?

我們會(huì)單獨(dú)開(kāi)一篇,聊聊基于業(yè)務(wù)的監(jiān)控與告警。

芯片設(shè)計(jì)五部曲的第三集——算法仿真篇到此結(jié)束啦。

一起期待下一集吧~

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
MBR0540T1G 1 onsemi 500 mA, 40 V, Schottky Power Rectifier, Surface Mount, SOD-123 2 LEAD, 3000-REEL

ECAD模型

下載ECAD模型
$0.43 查看
47589-0001 1 Molex Telecom and Datacom Connector, 5 Contact(s), Female, Right Angle, Surface Mount Terminal, Locking, Receptacle,

ECAD模型

下載ECAD模型
$0.89 查看
MCR72-8TG 1 Littelfuse Inc Silicon Controlled Rectifier, 8A I(T)RMS, 600V V(DRM), 600V V(RRM), 1 Element, TO-220AB, CASE 221A-09, 3 PIN
$1.06 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

我們致力于構(gòu)建為應(yīng)用定義的云,讓任何應(yīng)用程序始終以自動(dòng)化、更優(yōu)化和可擴(kuò)展的方式,在任何基礎(chǔ)架構(gòu)上運(yùn)行。希望和你共同建立持續(xù)迭代的多云世果觀。說(shuō)出你的應(yīng)用,我們就有故事~~