加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • ?萬卡是最低標(biāo)配
    • ?國產(chǎn)萬卡萬P萬億大模型訓(xùn)練平臺
    • ?共建大模型應(yīng)用生態(tài)
    • ?結(jié)語
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

摩爾線程CEO張建中:萬卡集群是AI主戰(zhàn)場上的標(biāo)配

07/04 11:25
1209
閱讀需 9 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合摩爾線程夸娥智算集群可實(shí)現(xiàn)從千卡至萬卡集群的無縫擴(kuò)展。

“從今天起,世界徹底改變了?!边@是GPT-3算法的發(fā)明人埃德·萊昂·克林格在GPT-3出現(xiàn)時(shí)說的一句話。這是一個(gè)AI的時(shí)代,這是一個(gè)算力的時(shí)代。今日,摩爾線程重磅宣布其AI旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案實(shí)現(xiàn)重大升級,從當(dāng)前的千卡級別大幅擴(kuò)展至萬卡規(guī)模。

同時(shí),摩爾線程聯(lián)合中國移動(dòng)通信集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司,分別就三個(gè)萬卡集群項(xiàng)目進(jìn)行了戰(zhàn)略簽約,多方聚力共同構(gòu)建好用的國產(chǎn)GPU集群。

此外,我們從現(xiàn)場也看到摩爾線程的產(chǎn)品能力和強(qiáng)大的生態(tài)鏈接力。與來自清華系兩家公司無問芯穹清程極智已經(jīng)開始深度合作,無問芯穹是由清華大學(xué)電子工程系系主任汪玉教授發(fā)起的,清程極智由清華大學(xué)計(jì)算機(jī)系鄭緯民院士發(fā)起的。還有京東、360、智平方等多家國內(nèi)企業(yè),夸娥智算集群助力其在大模型訓(xùn)練、大模型推理、具身智能等不同場景和領(lǐng)域的創(chuàng)新。

?萬卡是最低標(biāo)配

大模型自問世以來,關(guān)于其未來的走向和發(fā)展趨勢亟待時(shí)間驗(yàn)證,但從當(dāng)前來看,幾種演進(jìn)趨勢值得關(guān)注,使得其對算力的核心需求也愈發(fā)明晰。第一,Scaling Law將持續(xù)奏效。需要單點(diǎn)規(guī)模夠大并且通用的算力才能快速跟上技術(shù)演進(jìn)。第二,Transformer架構(gòu)不能實(shí)現(xiàn)大一統(tǒng),和其他架構(gòu)會(huì)持續(xù)演進(jìn)并共存,形成多元化的技術(shù)生態(tài)。第三,AI、3D和HPC跨技術(shù)與跨領(lǐng)域融合不斷加速,大模型的訓(xùn)練和應(yīng)用環(huán)境更加復(fù)雜多元。

隨著計(jì)算量不斷攀升,大模型訓(xùn)練亟需超級工廠,即一個(gè)“大且通用”的加速計(jì)算平臺,以縮短訓(xùn)練時(shí)間。以Llama 3為例,在它問世之際,Meta就公布了其基礎(chǔ)設(shè)施詳情:“我們在兩個(gè)定制的24K GPU集群上做訓(xùn)練?!?strong>摩爾線程創(chuàng)始人張建中提出了一個(gè)標(biāo)準(zhǔn):“AI主戰(zhàn)場,萬卡是最低標(biāo)配?!?/strong>

?國產(chǎn)萬卡萬P萬億大模型訓(xùn)練平臺

夸娥(KUAE)是摩爾線程智算中心全棧解決方案,是以全功能GPU為底座,軟硬一體化、完整的系統(tǒng)級算力解決方案,包括以夸娥計(jì)算集群為核心的基礎(chǔ)設(shè)施、夸娥集群管理平臺(KUAE Platform)以及夸娥大模型服務(wù)平臺(KUAE ModelStudio),旨在以一體化交付的方式解決大規(guī)模GPU算力的建設(shè)和運(yùn)營管理問題。

基于對AI算力需求的深刻洞察和前瞻性布局,摩爾線程夸娥智算集群可實(shí)現(xiàn)從千卡至萬卡集群的無縫擴(kuò)展,旨在滿足大模型時(shí)代對于算力“規(guī)模夠大+計(jì)算通用+生態(tài)兼容”的核心需求,通過整合超大規(guī)模的GPU萬卡集群、極致的計(jì)算效率優(yōu)化以及高度穩(wěn)定的運(yùn)行環(huán)境,以萬卡智算集群的新超級工程,重新定義國產(chǎn)集群計(jì)算能力的新標(biāo)準(zhǔn)??涠鹑f卡智算解決方案具備多個(gè)核心特性:

大算力,萬卡萬P。浮點(diǎn)運(yùn)算能力達(dá)到10Exa-Flops,大幅提升單集群計(jì)算性能,能夠?yàn)槿f億參數(shù)級別大模型訓(xùn)練提供堅(jiān)實(shí)算力基礎(chǔ)。

超高穩(wěn)定,月級長穩(wěn)訓(xùn)練。在集群穩(wěn)定性方面,摩爾線程夸娥萬卡集群平均無故障運(yùn)行時(shí)間超過15天,最長可實(shí)現(xiàn)大模型穩(wěn)定訓(xùn)練30天以上,周均訓(xùn)練有效率在99%以上,遠(yuǎn)超行業(yè)平均水平。

極致優(yōu)化,超高M(jìn)FU:實(shí)現(xiàn)大模型的高效率訓(xùn)練,MFU最高可達(dá)到60%。在系統(tǒng)軟件層面,基于極致的計(jì)算和通訊效率優(yōu)化等技術(shù)手段,大幅提升集群的執(zhí)行效率和性能表現(xiàn)。

全能通用,生態(tài)友好:可加速LLM、MoE、多模態(tài)、Mamba等不同架構(gòu)、不同模態(tài)的大模型。s同時(shí),基于高效易用的MUSA編程語言、完整兼容CUDA能力和自動(dòng)化遷移工具M(jìn)usify,加速新模型“Day0”級遷移,實(shí)現(xiàn)生態(tài)適配“Instant On”,助力客戶業(yè)務(wù)快速上線。

構(gòu)建萬卡集群并非一萬張GPU卡的簡單堆疊,而是一項(xiàng)高度復(fù)雜的超級系統(tǒng)工程。它涉及到超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計(jì)算、長期穩(wěn)定性和高可用性等諸多技術(shù)難題。

張建中也感嘆到:“萬卡集成的難度比登喜馬拉雅山還難?!?/strong>

?共建大模型應(yīng)用生態(tài)

根據(jù)《2023~2024年中國人工智能計(jì)算力發(fā)展評估報(bào)告》,中國智能算力規(guī)模正處于高速增長狀態(tài)。預(yù)計(jì)到2027年,中國智能算力規(guī)模將達(dá)1117.4EFLOPS,2022~2027年期間的年復(fù)合增長率為33.9%。萬卡集群的建設(shè)需要產(chǎn)業(yè)界的齊心協(xié)力,為實(shí)現(xiàn)大模型創(chuàng)新應(yīng)用的快速落地,讓國產(chǎn)算力“為用而建”。

在今日的發(fā)布會(huì)線程,摩爾線程攜手中國移動(dòng)通信集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司,分別就青海零碳產(chǎn)業(yè)園萬卡集群項(xiàng)目、青海高原夸娥萬卡集群項(xiàng)目、廣西東盟萬卡集群項(xiàng)目進(jìn)行了戰(zhàn)略簽約。

今年5月,摩爾線程與無問芯穹正式完成基于國產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實(shí)訓(xùn)。該模型名為“MT-infini-3B”。MT-infini-3B模型訓(xùn)練總用時(shí)13.2天,經(jīng)過精度調(diào)試,實(shí)現(xiàn)全程穩(wěn)定訓(xùn)練不中斷,集群訓(xùn)練穩(wěn)定性達(dá)到100%,千卡訓(xùn)練和單機(jī)相比擴(kuò)展效率超過90%。在行業(yè)內(nèi)率先開啟了國產(chǎn)大語言模型與國產(chǎn)GPU千卡智算集群深度合作的新范式。

清程極智與摩爾線程合作的過程中,發(fā)現(xiàn)其硬件架構(gòu)、指令集編譯器、MUSA軟件棧等設(shè)計(jì)非常優(yōu)秀,極具潛力。清程極智將與摩爾線程強(qiáng)強(qiáng)聯(lián)合,攜手打造世界水平的大模型基礎(chǔ)設(shè)施。

此外,摩爾線程還與360、京東云、智平方等多家國內(nèi)企業(yè)合作。

?結(jié)語

隨著今年“AI+”首次被寫入兩會(huì)工作報(bào)告,AI算力成為新質(zhì)生產(chǎn)力的重要引擎。智算中心不應(yīng)只是硬件的堆積,更是對軟硬一體化的GPU智算系統(tǒng)整合能力的考驗(yàn),GPU分布式計(jì)算系統(tǒng)的適配、算力集群的管理和高效推理引擎的應(yīng)用等,都是提高算力中心可用性的重要因素。

四年多的潛心發(fā)展,摩爾線程在 AI GPU 方面具備了強(qiáng)勁的實(shí)力,構(gòu)建起了一張包括芯片、板卡、服務(wù)器、集群和軟件棧的全棧 AI 產(chǎn)品版圖,并且已經(jīng)多點(diǎn)實(shí)現(xiàn)落地。正如摩爾線程創(chuàng)始人兼CEO張建中所言:“當(dāng)前,我們正處在生成式人工智能的黃金時(shí)代,技術(shù)交織催動(dòng)智能涌現(xiàn),GPU成為加速新技術(shù)浪潮來臨的創(chuàng)新引擎。

夸娥萬卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力,不僅有力彰顯了摩爾線程在技術(shù)創(chuàng)新和工程實(shí)踐上的實(shí)力,更將成為推動(dòng)AI產(chǎn)業(yè)發(fā)展的新起點(diǎn)。”

*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請聯(lián)系后臺。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
USB2514BI-AEZG-TR 1 SMSC USB Bus Controller, CMOS
$4.43 查看
ATSAMD21G18A-MUT 1 Atmel Corporation RISC Microcontroller, 32-Bit, FLASH, CORTEX-M0 CPU, 48MHz, CMOS, MO-220VKKD-4, QFN-48

ECAD模型

下載ECAD模型
$3.52 查看
ATXMEGA192D3-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64
$5.62 查看
摩爾線程

摩爾線程

摩爾線程致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代GPU,構(gòu)建融合視覺計(jì)算、3D圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺,建立基于云原生GPU計(jì)算的生態(tài)系統(tǒng),助力驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。

摩爾線程致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代GPU,構(gòu)建融合視覺計(jì)算、3D圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺,建立基于云原生GPU計(jì)算的生態(tài)系統(tǒng),助力驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時(shí)、專業(yè)、深度的前沿洞見、技術(shù)速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導(dǎo)體產(chǎn)業(yè),我們一直在路上。