加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

RISC-V HPC內(nèi)核從5nm遷移到4nm,1個月還是2天?

01/31 11:40
2341
閱讀需 6 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

5nm及以下的芯片是推動當今高端消費產(chǎn)品和數(shù)據(jù)中心技術(shù)的強大引擎。隨著消費設(shè)備越做越小、功能越來越強大,芯片的復(fù)雜性也在急劇增加。與此同時,半導(dǎo)體行業(yè)正面臨技術(shù)人才短缺的困境。因此,半導(dǎo)體公司想要盡快滿足市場需求所面臨的壓力是巨大的。

在提高效率和生產(chǎn)力方面,人工智能AI)是破題關(guān)鍵。AI在協(xié)助開發(fā)者優(yōu)化設(shè)計以滿足嚴苛的PPA目標方面相當成功。全球算力需求持續(xù)超出摩爾定律預(yù)測的增長速度,半導(dǎo)體公司亟需探尋如何有效地利用仍然可行的大規(guī)模設(shè)計,并將設(shè)計遷移到具有可用產(chǎn)能的相似制程上,同時充分發(fā)揮新制程的潛在性能和低功耗特性。

此類設(shè)計遷移項目通常作為全新項目來實施,需要的時間和開發(fā)資源與原項目相當。投入到項目中的時間和工作量會影響產(chǎn)品的上市時間和成本,進而影響此類產(chǎn)品和業(yè)務(wù)部署的可行性。?但AI可以讓芯片設(shè)計遷移工作變得更加精簡、更具成本效益。

2020年,新思科技推出DSO.ai。這項技術(shù)已被主流半導(dǎo)體公司用來更大限度地提高設(shè)計效率。最新一代的DSO.ai包括新的AI內(nèi)核引擎,可將周轉(zhuǎn)時間(TAT)縮短一半,并將設(shè)計質(zhì)量(QoR)提升多達20%。

自DSO.ai推出以來,其AI引擎不斷學習,并將所學的知識應(yīng)用于初始設(shè)計優(yōu)化和衍生設(shè)計等多個方面。在找尋滿足目標規(guī)格的最佳優(yōu)化策略時,AI引擎不是“冷”啟動,而是“熱”啟動。下一代DSO.ai可以將這種學習提升到一個新的水平,并將“熱”啟動功能應(yīng)用于衍生制程以實現(xiàn)設(shè)計遷移。

我們先來看一個制程遷移的案例:RISC-V高性能計算(HPC)內(nèi)核從5nm遷移到4nm的實際運用情況。

此案例研究中的5nm RISC-V HPC內(nèi)核為單個“大內(nèi)核”,擁有500,000個面向數(shù)據(jù)中心應(yīng)用的實例。5nm設(shè)計的原始目標規(guī)格包括性能至少達到1.95GHz,而功耗不超過30mW,并且內(nèi)核面積被指定為426um x 255um。新思科技Fusion Compiler RTL-to-GDSII實現(xiàn)解決方案采用開箱即用的RISC-V參考流程,能夠滿足面積和功耗要求,但性能有些許欠缺,僅為1.75Ghz??s小這一性能差距預(yù)計需要兩名專業(yè)開發(fā)者一個月的努力。

▲?RISC-V HPC 5nm設(shè)計的基線優(yōu)化結(jié)果

讓我們先了解一下設(shè)計空間優(yōu)化技術(shù)是如何從“冷啟動”開始應(yīng)用以達到優(yōu)化目標的。在此示例中,我們允許該解決方案優(yōu)化總共25個排列組合,包括來自RISC-V HPC工具箱的排列組合,以及時序、合法化引擎和功耗策略??紤]到排列組合的變化,理論上的搜索空間達到了1億的規(guī)模,也就是說,這個規(guī)模的搜索空間需要1億個Fusion Compiler作業(yè)才能實現(xiàn)覆蓋。然而,通過調(diào)用一個DSO.ai AI驅(qū)動的優(yōu)化主機,我們能夠?qū)⑺璧腇usion Compiler作業(yè)數(shù)量減少到在3次迭代中并行運行僅30個作業(yè)。該解決方案無需人工干預(yù),兩天內(nèi)即可完成任務(wù)。于是,在指定的面積參數(shù)范圍內(nèi),不僅可以滿足1.95GHz的目標性能規(guī)格,而且功耗(27.9mW)優(yōu)于預(yù)期。

▲?在5nm RISC-V HPC內(nèi)核上使用新思科技DSO.ai的優(yōu)化結(jié)果

現(xiàn)在,我們來看一看如何應(yīng)用從5nm“冷”啟動中學到的知識,在“熱”啟動場景中將設(shè)計遷移到4nm。從5nm到4nm,尺寸需要縮小10%,以滿足404um x 242um的面積要求。性能目標從1.95GHz提高到2.1GHz,同時功耗要求保持在30mW。排列組合變化的數(shù)量保持不變,因此搜索空間的規(guī)模仍為1億。通過使用5nm設(shè)計中的訓練數(shù)據(jù)庫,計算配置從3次迭代中并行運行30個Fusion Compiler作業(yè)減少到單次迭代中運行15個Fusion Compiler作業(yè),作業(yè)數(shù)量減少到了“冷”啟動的六分之一。在無需人工干預(yù)的情況下,該解決方案能夠在一天內(nèi)完成任務(wù)。最終結(jié)果是在縮小的目標面積內(nèi),性能大幅提升至2.15GHz,功耗降至29.4mW。

▲?使用新思科技DSO.ai時的設(shè)計遷移結(jié)果

在這個市場窗口緊縮、設(shè)計日益復(fù)雜、技術(shù)人才短缺的時代,開發(fā)團隊能夠借助人工智能將設(shè)計高效遷移到更小尺寸,進而充分利用經(jīng)驗證的設(shè)計并更大限度地提高生產(chǎn)力。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
ATMEGA328P-AU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 20MHz, CMOS, PQFP32, 7 X 7 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026ABA, TQFP-32

ECAD模型

下載ECAD模型
$2.05 查看
XC7Z010-1CLG400C 1 AMD Xilinx Multifunction Peripheral, CMOS, PBGA400, BGA-400

ECAD模型

下載ECAD模型
$62.79 查看
MK10DX256VLH7R 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64
$9.1 查看
Synaptics

Synaptics

Synaptics(NASDAQ:SYNA)是人機交互界面變革的先鋒和領(lǐng)導(dǎo)者,為智能設(shè)備提供創(chuàng)新性和直觀式用戶體驗。Synaptics擁有強大的研發(fā)能力、廣泛的知識產(chǎn)權(quán)和可靠的供應(yīng)鏈能力,以此為基礎(chǔ)開發(fā)了豐富的觸控、顯示和生物識別產(chǎn)品。Synaptics提供面向移動、PC和汽車行業(yè)的解決方案,產(chǎn)品兼具易用性、功能性和美觀性,有助于使我們的數(shù)字化生活更富成效、更安全、更有趣。

Synaptics(NASDAQ:SYNA)是人機交互界面變革的先鋒和領(lǐng)導(dǎo)者,為智能設(shè)備提供創(chuàng)新性和直觀式用戶體驗。Synaptics擁有強大的研發(fā)能力、廣泛的知識產(chǎn)權(quán)和可靠的供應(yīng)鏈能力,以此為基礎(chǔ)開發(fā)了豐富的觸控、顯示和生物識別產(chǎn)品。Synaptics提供面向移動、PC和汽車行業(yè)的解決方案,產(chǎn)品兼具易用性、功能性和美觀性,有助于使我們的數(shù)字化生活更富成效、更安全、更有趣。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜