6月11日-13日,以“開源賦能,普惠未來”為主題的2023開放原子全球開源峰會在北京舉辦。張先軼博士受邀在開源工業(yè)軟件分論壇作《高性能數(shù)學(xué)庫與異構(gòu)計(jì)算軟件棧進(jìn)展》主題報(bào)告。
時(shí)間:2023/6/12
報(bào)告簡介
在報(bào)告中,張先軼博士首先以CUDA和OpenCL為例,強(qiáng)調(diào)了開源未必能勝過閉源,能否構(gòu)建一個(gè)良好的軟硬件生態(tài)系統(tǒng)才是成功的關(guān)鍵。目前在計(jì)算領(lǐng)域,構(gòu)建得比較成熟的函數(shù)庫有Intel的MKL、ARM的APL和ACL、NVIDA的CUDA-X等。而國內(nèi)的計(jì)算芯片雖然在科學(xué)計(jì)算領(lǐng)域已經(jīng)有了一定的積累,但大多都是各成一家或者向某家靠攏,沒有設(shè)立統(tǒng)一的接口和標(biāo)準(zhǔn),大環(huán)境不夠成熟。
為了解決這一問題,澎峰提出“參與開源,共建生態(tài),立足國內(nèi),走向國際”的口號,以萬萬開源工作者對開源社區(qū)的貢獻(xiàn)為基礎(chǔ),共同建立良好的開源軟件生態(tài),并以開源生態(tài)滋養(yǎng)閉源產(chǎn)品。
為此,澎峰做了以下工作:
1.PerfXAPI異構(gòu)計(jì)算軟件棧
PerfXAPI 圍繞應(yīng)用側(cè)需求,旨在創(chuàng)建一個(gè)開放、基于開源標(biāo)準(zhǔn)的跨架構(gòu)API編程模型,在面對大量跨各種架構(gòu)的硬件和復(fù)雜工作負(fù)載場景時(shí)簡化開發(fā)工作。
優(yōu)勢:1)支持多種異構(gòu)設(shè)備;2)統(tǒng)一API調(diào)用接口;3)高性能。
2.PerfMPL高性能數(shù)學(xué)庫
包含Openblas、Libm/PerfMath、BLAS、LAPACK、FTT等基本庫。目前已有PerfMPL for ARM、PerfMPL for RISC-V(RVCL)的標(biāo)準(zhǔn)版本。支持為EDA、CFD等應(yīng)用領(lǐng)域提供定向優(yōu)化,支持為國產(chǎn)GPU/NPU廠商提供對標(biāo)cuBLAS、cuFFT、cuMath等的定制服務(wù)。
其中,OpenFFT/PerfFFT是完全由澎峰自主研發(fā),不基于FFTW,版權(quán)協(xié)議可控的FFT庫,并支持X86、ARM、RISC-V等主流處理器,相對其他FFT庫性能方面均有提升。
優(yōu)勢:1)性能對標(biāo)國際;2)一致精度;3)安全、可靠、穩(wěn)定。
3.PerfXPy 新一代科學(xué)計(jì)算軟件
PerfXPy 是一個(gè)面向科學(xué)家和算法工程師的高性能Python計(jì)算平臺,兼顧易用性與高性能,支持ARM、RISC-V 通用算力平臺和異構(gòu)加速平臺。并有單機(jī)版(免費(fèi))、SaaS版本、集群版本等多個(gè)版本。