5nm及以下的芯片是推動當今高端消費產(chǎn)品和數(shù)據(jù)中心技術(shù)的強大引擎。隨著消費設(shè)備越做越小、功能越來越強大,芯片的復(fù)雜性也在急劇增加。與此同時,半導(dǎo)體行業(yè)正面臨技術(shù)人才短缺的困境。因此,半導(dǎo)體公司想要盡快滿足市場需求所面臨的壓力是巨大的。
在提高效率和生產(chǎn)力方面,人工智能(AI)是破題關(guān)鍵。AI在協(xié)助開發(fā)者優(yōu)化設(shè)計以滿足嚴苛的PPA目標方面相當成功。全球算力需求持續(xù)超出摩爾定律預(yù)測的增長速度,半導(dǎo)體公司亟需探尋如何有效地利用仍然可行的大規(guī)模設(shè)計,并將設(shè)計遷移到具有可用產(chǎn)能的相似制程上,同時充分發(fā)揮新制程的潛在性能和低功耗特性。
此類設(shè)計遷移項目通常作為全新項目來實施,需要的時間和開發(fā)資源與原項目相當。投入到項目中的時間和工作量會影響產(chǎn)品的上市時間和成本,進而影響此類產(chǎn)品和業(yè)務(wù)部署的可行性。?但AI可以讓芯片設(shè)計遷移工作變得更加精簡、更具成本效益。
2020年,新思科技推出DSO.ai。這項技術(shù)已被主流半導(dǎo)體公司用來更大限度地提高設(shè)計效率。最新一代的DSO.ai包括新的AI內(nèi)核引擎,可將周轉(zhuǎn)時間(TAT)縮短一半,并將設(shè)計質(zhì)量(QoR)提升多達20%。
自DSO.ai推出以來,其AI引擎不斷學習,并將所學的知識應(yīng)用于初始設(shè)計優(yōu)化和衍生設(shè)計等多個方面。在找尋滿足目標規(guī)格的最佳優(yōu)化策略時,AI引擎不是“冷”啟動,而是“熱”啟動。下一代DSO.ai可以將這種學習提升到一個新的水平,并將“熱”啟動功能應(yīng)用于衍生制程以實現(xiàn)設(shè)計遷移。
我們先來看一個制程遷移的案例:RISC-V高性能計算(HPC)內(nèi)核從5nm遷移到4nm的實際運用情況。
此案例研究中的5nm RISC-V HPC內(nèi)核為單個“大內(nèi)核”,擁有500,000個面向數(shù)據(jù)中心應(yīng)用的實例。5nm設(shè)計的原始目標規(guī)格包括性能至少達到1.95GHz,而功耗不超過30mW,并且內(nèi)核面積被指定為426um x 255um。新思科技Fusion Compiler RTL-to-GDSII實現(xiàn)解決方案采用開箱即用的RISC-V參考流程,能夠滿足面積和功耗要求,但性能有些許欠缺,僅為1.75Ghz??s小這一性能差距預(yù)計需要兩名專業(yè)開發(fā)者一個月的努力。
▲?RISC-V HPC 5nm設(shè)計的基線優(yōu)化結(jié)果
讓我們先了解一下設(shè)計空間優(yōu)化技術(shù)是如何從“冷啟動”開始應(yīng)用以達到優(yōu)化目標的。在此示例中,我們允許該解決方案優(yōu)化總共25個排列組合,包括來自RISC-V HPC工具箱的排列組合,以及時序、合法化引擎和功耗策略??紤]到排列組合的變化,理論上的搜索空間達到了1億的規(guī)模,也就是說,這個規(guī)模的搜索空間需要1億個Fusion Compiler作業(yè)才能實現(xiàn)覆蓋。然而,通過調(diào)用一個DSO.ai AI驅(qū)動的優(yōu)化主機,我們能夠?qū)⑺璧腇usion Compiler作業(yè)數(shù)量減少到在3次迭代中并行運行僅30個作業(yè)。該解決方案無需人工干預(yù),兩天內(nèi)即可完成任務(wù)。于是,在指定的面積參數(shù)范圍內(nèi),不僅可以滿足1.95GHz的目標性能規(guī)格,而且功耗(27.9mW)優(yōu)于預(yù)期。
▲?在5nm RISC-V HPC內(nèi)核上使用新思科技DSO.ai的優(yōu)化結(jié)果
現(xiàn)在,我們來看一看如何應(yīng)用從5nm“冷”啟動中學到的知識,在“熱”啟動場景中將設(shè)計遷移到4nm。從5nm到4nm,尺寸需要縮小10%,以滿足404um x 242um的面積要求。性能目標從1.95GHz提高到2.1GHz,同時功耗要求保持在30mW。排列組合變化的數(shù)量保持不變,因此搜索空間的規(guī)模仍為1億。通過使用5nm設(shè)計中的訓練數(shù)據(jù)庫,計算配置從3次迭代中并行運行30個Fusion Compiler作業(yè)減少到單次迭代中運行15個Fusion Compiler作業(yè),作業(yè)數(shù)量減少到了“冷”啟動的六分之一。在無需人工干預(yù)的情況下,該解決方案能夠在一天內(nèi)完成任務(wù)。最終結(jié)果是在縮小的目標面積內(nèi),性能大幅提升至2.15GHz,功耗降至29.4mW。
▲?使用新思科技DSO.ai時的設(shè)計遷移結(jié)果
在這個市場窗口緊縮、設(shè)計日益復(fù)雜、技術(shù)人才短缺的時代,開發(fā)團隊能夠借助人工智能將設(shè)計高效遷移到更小尺寸,進而充分利用經(jīng)驗證的設(shè)計并更大限度地提高生產(chǎn)力。