加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

國產(chǎn)GPU能否驅(qū)動大模型落地?

2023/07/26
3983
閱讀需 4 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

2012年,谷歌團隊推出著名的八層卷積神經(jīng)網(wǎng)絡模型AlexNet,在人臉識別方面大幅提升了圖像識別準確率,帶動了硬件層面卷積的普及。

2017年,谷歌團隊又推出基于自注意力機制的模型Transformer,在語義理解方面大幅提升了語音翻譯效果,帶動了硬件層面GEMM的普及。

2018年OpenAI團隊推出一種預訓練語言模型GPT(Generative Pre-trained Transformer),也就是最初代的GPT-1(12層),并通過了圖靈測試

圖源:WAIC,天數(shù)智芯

也許在GPT-1時代,大眾還沒有什么感受,但GPT-3、GPT-4架構(gòu)下的ChatGPT人工智能成功出圈,并產(chǎn)生了全球性的“大模型AIGC”。于是,我們從硬件的角度來看,GPT到底帶來了哪些變革?

事實上,算力是關乎大模型產(chǎn)品成功與否的關鍵,那么大模型需要多少算力呢?天數(shù)智芯副總裁鄒翾表示:“對于頭部企業(yè)來講,預計需要1萬張最新的主流GPU,而對于追隨企業(yè)來講,為了追趕頭部企業(yè)的步伐,他們在基礎設施方面的需求可能更大?!?/p>

正是在這樣的大算力需求下,市面上英偉達芯片貴出天際。據(jù)悉,國內(nèi)幾家頭部互聯(lián)網(wǎng)廠家都向英偉達下了1.5萬-1.6萬的A800和H800訂單,每家的金額在十幾億美金左右,而這些產(chǎn)能將在2024年得到基本保障。

在這樣的大背景下,我們看到新聞,竟然有人開始走私GPU卡,特斯拉CEO馬斯克對此表示:“目前,GPU比毒品更難獲得”。當然,違法的行為不可取,但我們真切地看到了大模型“算力發(fā)動機”的威力。

換言之,大模型對硬件的最大需求就是要有可用的算力,那么這個“可用”到底如何體現(xiàn)呢?通??梢詮娜齻€方面來理解:

  • 易用

需要利舊現(xiàn)有算法模塊,且調(diào)優(yōu)經(jīng)驗可借鑒

  • 通用

需要可支持模型的快速變形,快速支持新算子,以及快速支持新通訊(重組)

  • 靈活并行

需要滿足訪存全交換和計算全互聯(lián)

結(jié)合當前市場上的可用產(chǎn)品,主要包括GPU和ASIC芯片。然而,相比于ASIC芯片,GPGPU具有更強的通用性,所以在主流的AI加速芯片市場上,GPGPU占到了90%的市場份額。

?此外,雖然說大模型不像中、小模型那樣依賴CUDA生態(tài),看上去GPGPU和ASIC在大模型上的差距沒有那么大,但不管是模型的訓練還是部署,大模型早期的開放框架都是基于GPGPU架構(gòu)實現(xiàn)的,因此GPGPU的軟件生態(tài)會更為成熟,而ASIC還處在開局階段。

對此,鄒翾表示:“天數(shù)智芯作為國內(nèi)第一家實現(xiàn)設計、制造、量產(chǎn)的GPGPU企業(yè),當前已經(jīng)實現(xiàn)了商業(yè)閉環(huán),并在大模型訓練領域取得了階段性進展,完成了百億級參數(shù)大模型訓練。”

下圖中為天數(shù)智芯推出的天垓100加速卡已經(jīng)支持的模型訓練集合:

圖 | 天垓100已支持百億級參數(shù)大模型訓練

從市場方面來看,鄒翾認為:“去年還主要是天垓100在出貨,而今年天垓100和智鎧100一起出貨,在整體市場體量方面會更加趨好?!?/p>

 

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
MK70FN1M0VMJ12R 1 Freescale Semiconductor 32-BIT, FLASH, 120MHz, RISC MICROCONTROLLER, PBGA256, 17 X 17 MM, MAPBGA-256
暫無數(shù)據(jù) 查看
PIC24EP512GU810-I/PT 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下載ECAD模型
$10.44 查看
P82B715TD,118 1 NXP Semiconductors P82B715 - I2C-bus extender SOIC 8-Pin

ECAD模型

下載ECAD模型
$4.97 查看
天數(shù)智芯

天數(shù)智芯

上海天數(shù)智芯半導體有限公司(簡稱“天數(shù)智芯”)于 2018 年正式啟動通用并行 云端計算芯片設計,是中國通用GPU 云端芯片及超級算力系統(tǒng)提供商。

上海天數(shù)智芯半導體有限公司(簡稱“天數(shù)智芯”)于 2018 年正式啟動通用并行 云端計算芯片設計,是中國通用GPU 云端芯片及超級算力系統(tǒng)提供商。收起

查看更多

相關推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)副主編 通信專業(yè)出身,從事電子研發(fā)數(shù)余載,擅長從工程師的角度洞悉電子行業(yè)發(fā)展動態(tài)。