“2005年,在一個演講中,有專業(yè)人士預(yù)判,設(shè)計芯片的驗證工作量占比將來會超過70%,當(dāng)時我很震驚。但事實證明,這一年來,我們所有的合作伙伴、客戶在芯片驗證領(lǐng)域所花的人力、物力已經(jīng)超過了70%。這是發(fā)展的歷史見證,當(dāng)芯片規(guī)模越來越大、設(shè)計越來越復(fù)雜、制程也越來越復(fù)雜,對于芯片的成功設(shè)計和生產(chǎn),驗證工作變得彌足珍貴,直接關(guān)乎勝敗?!?西門子EDA全球副總裁兼中國區(qū)總經(jīng)理凌琳如是說。
的確,在過去20年時間里,驗證的方法論,特別是硬件輔助驗證,已經(jīng)成為EDA客戶的關(guān)注焦點。與此同時,根據(jù)業(yè)界實踐數(shù)據(jù)顯示,采用硬件輔助驗證的IC設(shè)計項目在首次硅片成功率(First Silicon Success)上有顯著提升,減少了大量的返工時間和成本。基于此,市場調(diào)研機構(gòu)預(yù)測,2019-2024年間,硬件輔助驗證市場的復(fù)合年增長率(CAGR)預(yù)計超過10%。而未來,隨著AI、ML、大規(guī)模計算技術(shù)的持續(xù)發(fā)展,對硬件輔助驗證市場的需求也會同步提升。
硬件輔助驗證平臺是什么?
提到硬件輔助驗證平臺,可以參考AMD提出的三層解決方案空間觀點,即硬件仿真加速、企業(yè)級原型驗證、軟件原型驗證。
圖 | 西門子EDA硬件輔助驗證產(chǎn)品管理高級總監(jiān)Vijay Chobisa介紹三層解決方案空間
首先,我們來看硬件仿真加速,芯片設(shè)計團隊需要有快速的編譯,用于設(shè)計的bring up、迭代和調(diào)試,并且循環(huán)往復(fù)地快速去做這項工作。由于在設(shè)計仿真的早期就需要用到硬件仿真加速,所以需要全信號可見,來實現(xiàn)快速的調(diào)試。
其次,我們來看企業(yè)級原型驗證,當(dāng)我們的設(shè)計相對穩(wěn)定下來,不需要再去做頻繁的更改時,就可以把驗證的工作推進到原型驗證階段,包括早期的固件和嵌入式的軟件驗證,從而實現(xiàn)在更長的工作鏈路上看到整個軟件的工作量。
對于企業(yè)級原型驗證而言,高度的一致性非常重要,這個一致指的是硬件仿真加速和企業(yè)級原型驗證的一致性,也就是可以把整個硬件加速的結(jié)果轉(zhuǎn)換到企業(yè)級原型驗證當(dāng)中,同時如果在原型驗證中有一些具體的調(diào)試問題,也可以返回硬件仿真加速。
最后,我們來看軟件原型驗證,這個主要是給軟件工程師使用的,換言之,系統(tǒng)軟件工程師可以在芯片還未流片前就能初步測試軟件的功能和性能表現(xiàn)。同時,為了保持系統(tǒng)級驗證,需要有高速接口和IP驗證,以及靈活的配置,比如更改連接線,或人工更改分區(qū)等,達到以最低的成本實現(xiàn)最高的性能吞吐率。
根據(jù)與非網(wǎng)的觀察,當(dāng)前全球主要的硬件輔助驗證市場企業(yè)包括西門子、Agnisys、Aldec、新思科技(ANSYS)、Blue Pearl Software、Cadence、EMA Design Automation、Hardent和Innovative Logic等,這些第一、第二梯隊的企業(yè)占據(jù)了大量的市場份額。
行業(yè)獨家,西門子同步發(fā)布三大硬件輔助驗證系統(tǒng)平臺Veloce CS
作為全球硬件輔助驗證市場中重要的平臺提供者,近日西門子數(shù)字化工業(yè)軟件推出 Veloce CS 硬件輔助驗證和確認系統(tǒng),該系統(tǒng)融合了硬件仿真、企業(yè)原型驗證和軟件原型驗證三大產(chǎn)品板塊:
- 用于硬件加速仿真的 Veloce Strato CS 硬件
- 用于企業(yè)原型驗證的 Veloce Primo CS 硬件
- 用于軟件原型驗證的 Veloce proFPGA CS 硬件
圖 | 西門子同時宣布新一代三大硬件輔助驗證產(chǎn)品
隨著Veloce CS的推出,西門子也躍升為業(yè)界唯一擁有3個硬件系統(tǒng)平臺的公司,其他競爭對手最多擁有其中1~2個硬件系統(tǒng)平臺。
事實上,如果大家對西門子的硬件輔助驗證工具有所了解,可以看到2021年西門子曾推出Veloce硬件輔助驗證系統(tǒng),該系統(tǒng)融合了虛擬平臺、硬件仿真和 FPGA 原型驗證技術(shù)。所以今年推出的Veloce CS一方面是三年前Veloce的升級,另一方面又通過收購整合增加了軟件原型驗證的平臺。
根據(jù)西門子EDA硬件輔助驗證產(chǎn)品管理高級總監(jiān)Vijay Chobisa的介紹,Veloce CS相比Veloce的提升不是一丁半點,包括速度提升了5-15倍,能耗減少了2倍,密度又提升了2倍。以硬件加速仿真產(chǎn)品為例,與上一代 Veloce Strato 相比,Veloce Strato CS 的硬件加速仿真性能顯著提高,最高可達 5 倍,同時還可保持完全的可觀測性,支持能力從 4000 萬門電路擴展到超過 400 億門電路。
圖 | Veloce Strato CS + Veloce Primo CS,提供完整統(tǒng)一的硬件/軟件開發(fā)和驗證平臺
他還提到,Veloce Strato CS和Veloce Primo CS出自同一個研發(fā)團隊,外部長相一致,系統(tǒng)架構(gòu)一致,運行環(huán)境一致,并能在不同平臺之間無縫移動,所以可以大大提升用戶在啟動、設(shè)置、調(diào)試和工作負載執(zhí)行的速度。如果將其量化,Veloce Strato CS和Veloce Primo CS雙機運行大約可提高6~10倍的生產(chǎn)力/收益。
此外,提到軟件原型驗證平臺,它的入門成本是非常低的,用戶可以根據(jù)自己的體量需求來制定小、中、大型的系統(tǒng)配置,小型的包括單塊FPGA和4塊FPGA的桌面級原型,中型和大型的則采用刀片式架構(gòu),可從6個FPGA擴展至180個FPGA(6個為一個刀片,30個刀片即為180個FPGA),非常靈活。
自研芯片CrystalX+刀片系統(tǒng),實現(xiàn)從4000萬到400億的可拓展性
前面提到Veloce Strato CS擁有從 4000 萬門電路擴展到超過 400 億門電路的能力,這是如何實現(xiàn)的呢?
有一點很重要,那就是整個Veloce CS平臺都采用了模塊化刀片配置,可以像搭建樂高積木一樣往上累加,不僅提高了系統(tǒng)電路能力的上限,還增加了靈活性,并在規(guī)模效應(yīng)中降低了成本。事實上,模塊化刀片配置在高性能計算市場是非常主流的一個趨勢,尤其符合現(xiàn)代數(shù)據(jù)中心的占地要求、能耗要求以及冷卻要求。
除此之外,基礎(chǔ)硬件的升級也是Veloce CS性能表現(xiàn)突出的重要基礎(chǔ)。
據(jù)悉,Veloce Strato CS搭載了完全由西門子自主設(shè)計的專用加速器芯片——CrystalX,該芯片采用7nm制程工藝,疊加薄膜技術(shù)的創(chuàng)新和2.5D IC堆棧技術(shù),可以幫助客戶實現(xiàn)更加快速的可預(yù)測的編譯、設(shè)計、啟動和迭代。
圖 | Veloce CS 系列產(chǎn)品的技術(shù)基礎(chǔ)
而Veloce Primo CS和Veloce proFPGA CS則均采用了AMD的自適應(yīng)FPGA產(chǎn)品——VP1902,這也是Veloce Primo CS和Veloce Strato CS在底層技術(shù)上的重要區(qū)別。
值得一提的是,由于CrystalX芯片里有一個邏輯分析器,所以Veloce Strato CS的調(diào)試性能會比Veloce Primo CS更好。
關(guān)于下一步西門子是否會考慮自研更多芯片,來替代AMD的FPGA應(yīng)用時,Vijay Chobisa表示:“AMD既是西門子的供應(yīng)商,又是西門子的客戶,雙方合作非常緊密,而西門子暫時也還沒有計劃自研原型驗證用的SoC或FPGA產(chǎn)品,來替代現(xiàn)有的這種高效組合。”
10億門容量,只要10千瓦能耗,是競對的1/7~1/6
我們在前面的章節(jié)提到了全球主要的硬件輔助驗證市場企業(yè),那么如何來評判這些企業(yè)的產(chǎn)品在市場中的地位和特色呢?首先用戶的體驗和反饋是首要的,另外在全球性推動經(jīng)濟結(jié)構(gòu)綠色轉(zhuǎn)型的今天,能耗也是大家關(guān)注的焦點。
據(jù)悉,Veloce CS平臺使用的是風(fēng)冷系統(tǒng),不需要額外的液體或水的冷卻,所以在10億門的容量上大概需要10千瓦的能耗,與競對產(chǎn)品相比,Veloce CS平臺的功耗是行業(yè)最低,僅從用電和冷卻方面就可節(jié)省數(shù)百萬美元。