作者?|??李水青,編輯?|??心緣
一口氣發(fā)六大行業(yè)模型,華為云在大模型戰(zhàn)場“掀桌子”了。
盡管近期大模型產(chǎn)業(yè)打得不可開交,但華為的AI野心,與瘋狂的價格戰(zhàn)和刷榜競賽無關(guān)!
智東西6月21日東莞報道,今日,中國南方的陽光明媚熱烈,在下午開幕的華為開發(fā)者大會2024上,華為常務(wù)董事、華為云CEO張平安重磅發(fā)布盤古大模型5.0。
華為AI核彈“Harmony Intelligence(鴻蒙原生智能)”滾燙發(fā)布,呈現(xiàn)出華為AI“云+端”的行業(yè)獨一家打法,同時盤古5.0大模型的鼎力支持更顯耀眼。
盤古大模型5.0實現(xiàn)從十億級到萬億級參數(shù)版本全覆蓋,小到十億級參數(shù)的Pangu E系列,可支撐手機、PC等端側(cè)應(yīng)用;大到萬億級參數(shù)的Pangu S系列,能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。
在技術(shù)能力方面,盤古大模型5.0在全系列、多模態(tài)、強思維三大方面帶來全新升級,同時在現(xiàn)場具身智能機器人與真人交互、視頻生成及AI語音合成、模擬物理世界3D生成等展示一輪接著一輪。
但更加引起關(guān)注的是,華為云一口氣發(fā)布了盤古鋼鐵大模型、盤古高鐵大模型、盤古具身智能大模型、盤古工業(yè)設(shè)計大模型、盤古安全大模型及盤古媒體大模型六大模型,通過其特有的“行業(yè)難題死磕者”氣質(zhì),引得觀眾陣陣“遙遙領(lǐng)先,一直領(lǐng)先”呼聲。
但華為云的“殺招”遠(yuǎn)不止如此。
在盤古5.0背后,華為云昇騰AI云服務(wù)已快速迭代一年,服務(wù)超100個業(yè)內(nèi)主流大模型。同時,華為云ModelArts studio、CodeArts、DataArts、MetaStudio等多條生產(chǎn)線也基于盤古大模型實現(xiàn)升級,下一代云基礎(chǔ)設(shè)施CloudMatrix助力模型訓(xùn)練效率提升68%,業(yè)界首創(chuàng)EMS彈性內(nèi)存存儲正式發(fā)布,都在重塑華為云服務(wù)。
此外,華為云還首次揭秘了盤古5.0誕生的背后技術(shù),包括公布了昇騰親和的新模型架構(gòu)π、MindStar技術(shù)等十幾項核心技術(shù)點,講解了其如何實現(xiàn)數(shù)據(jù)高效、效率高效、參數(shù)高效。
01.從10億到萬億參數(shù)全覆蓋,多模態(tài)強思維,打造“世界模型”?
張平安宣布,盤古5.0在全系列、多模態(tài)、強思維三個方面實現(xiàn)全新升級。而在他近40分鐘的演講中,透露華為云不僅將熱門的視覺理解與生成、復(fù)雜任務(wù)推理等高階能力升級,還多次提及模型“遵循物理規(guī)律”,隱隱透露出華為云打造“世界模型”的野心。
1、全系列:從十億級到萬億級參數(shù),從手機到云全覆蓋
盤古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場景。十億級參數(shù)的Pangu E系列可支撐手機、PC等端側(cè)的智能應(yīng)用;百億級參數(shù)的Pangu P系列,適用于低時延、高效率的推理場景。千億級參數(shù)的Pangu U系列適用于處理復(fù)雜任務(wù);萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。
2、多模態(tài):支持10K超圖像識別,生成內(nèi)容模擬物理世界
本次鴻蒙原生智能更新的小藝智能體,很多能力用到了盤古5.0多模態(tài)理解和生成能力。盤古大模型5.0能夠更好更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,盤古大模型5.0可支持10K超高分辨率。比如當(dāng)被問到《清明上河圖》中趙太丞家有多少人,盤古5.0可以在占全圖1/200的畫面中,識別出細(xì)小畫面和漢字,并得出“4個人”這一正確答案。
在內(nèi)容生成方面,盤古大模型5.0采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術(shù),聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。
3、強思維:思維鏈結(jié)合策略搜索,支持復(fù)雜推理
復(fù)雜邏輯推理是大模型成為行業(yè)助手的關(guān)鍵。盤古大模型5.0將思維鏈技術(shù)與策略搜索深度結(jié)合,極大地提升了數(shù)學(xué)能力、復(fù)雜任務(wù)規(guī)劃能力以及工具調(diào)用能力。但華為云今日并未公布其在各大榜單中的得分情況。
02.具身智能機器人現(xiàn)場“活了”,推出六大行業(yè)模型
基于盤古具身智能大模型的人形機器人首次登場,現(xiàn)場演示了復(fù)雜任務(wù)執(zhí)行。名為“夸父”的人形機器人能夠在要求下與張平安擊掌,分辨位于它面前的與華為有關(guān)的物品,并在得知主持人口渴時,將面前桌上的水遞給了口渴的主持人。
去年,張平安在發(fā)布盤古3.0時稱,華為云盤古大模型“不作詩,只做事”。今年,盤古5.0已經(jīng)進(jìn)入各行各業(yè)做事,解決行業(yè)難題。在工業(yè)設(shè)計領(lǐng)域,盤古大模型可以讓汽車的造型設(shè)計時間大幅縮短,助設(shè)計師直接輸出成3D文件;可以支持建筑師在輸入設(shè)計草圖的情況下,生成彩色并帶有紋理的建筑群360°實景視頻。
在媒體產(chǎn)業(yè),華為云推出盤古媒體大模型,通過在語音生成、視頻生成和AI翻譯三方面的技術(shù)創(chuàng)新,重塑內(nèi)容生產(chǎn)和應(yīng)用的新模式。盤古媒體大模型在視頻生成方面取得了顯著成果,支持將實拍視頻轉(zhuǎn)換為不同風(fēng)格的高清動漫,現(xiàn)場演示視頻中演員的舞蹈、武打等大運動軌跡能保持一致視覺效果,角色的面貌特征也保持前后一致。
在語音生成方面,盤古大模型通過AI原聲譯制與視頻生成能力,實現(xiàn)了將原片譯制成不同語言的視頻,還能同步生成新的口型。在AI翻譯方面,華為云會議基于盤古大模型實現(xiàn)了升級,支持同聲傳譯,翻譯準(zhǔn)確性高于93%,時延小于5秒,解決跨語言溝通難題。參會者還基于數(shù)字人分身功能,在自己不出面的情況下,讓實時合成的數(shù)字人分身來替自己發(fā)言,講述起來流暢自然。
但真正更令現(xiàn)場沸騰的,是華為云盤古大模型還進(jìn)入了更多專業(yè)化更強、與生產(chǎn)息息相關(guān)的行業(yè)。在高鐵行業(yè),基于盤古高鐵大模型,華為云為高鐵檢測裝上了“盤古眼”,幫巡檢工人減少了巨大的工作量。一列動車的3.2萬個故障檢測項點,本來需要4人花費2小時進(jìn)行反復(fù)、細(xì)致地檢查,用盤古大模型可以自動識別準(zhǔn)確率可達(dá)99%。
再拿鋼鐵大模型來說,寶武集團(tuán)是中國最大的鋼鐵集團(tuán),年鋼產(chǎn)量超1億噸。據(jù)稱盤古鋼鐵大模型已經(jīng)幫他們把大模型與高爐煉鐵和熱軋鋼帶環(huán)節(jié)結(jié)合了起來,通過現(xiàn)場學(xué)習(xí)實現(xiàn)實時預(yù)測最優(yōu)參數(shù),最終效率提升了數(shù)十倍。
除此之外,在氣象、醫(yī)藥等其他行業(yè),盤古大模型也已經(jīng)在助力解決行業(yè)難題。死磕行業(yè)的打法,體現(xiàn)了華為云有別于很多其他大模型廠商的獨特氣質(zhì)。
03.昇騰AI云已服務(wù)100+大模型,免費為開發(fā)者提供一臺云主機
華為云的“殺招”不止于此,盤古5.0升級背后,是華為云昇騰AI云服務(wù)的一年迭代優(yōu)化。目前,華為云已經(jīng)在貴安、烏蘭察布和蕪湖,構(gòu)建了三大AI算力中心,支持大模型產(chǎn)業(yè)發(fā)展。
根據(jù)華為云官方數(shù)據(jù):業(yè)界萬億參數(shù)模型訓(xùn)練的平均無中斷時長約2.8天,昇騰AI云服務(wù)可實現(xiàn)40天無中斷;業(yè)界平均集群故障恢復(fù)時間約60分鐘,昇騰AI云服務(wù)可以縮短到10分鐘。同時,昇騰AI云服務(wù)能將大模型的資源開通時間從月級縮短到天級,加速大模型的開發(fā)。目前昇騰AI云服務(wù)已全面適配行業(yè)主流的100多個大模型,以云服務(wù)的方式協(xié)助客戶開發(fā)、訓(xùn)練、托管和應(yīng)用模型,打造百模千態(tài)的“黑土地”。
張平安宣布,華為發(fā)布華為開發(fā)者布道師計劃,未來3年計劃發(fā)展超過3000名華為開發(fā)者布道師。了讓開發(fā)者更好地學(xué)習(xí)和使用這些技術(shù),華為云為每個新生態(tài)的開發(fā)者免費提供一臺云主機、一套開發(fā)工具和5GB的云存儲空間。華為云通過全棧系統(tǒng)性創(chuàng)新結(jié)合AI重塑云服務(wù),打造AI Native的云。
通過下一代云基礎(chǔ)設(shè)施CloudMatrix,華為云推動單體算力向矩陣算力發(fā)展。盤古5.0在同等NPU算力基礎(chǔ)上,CloudMatrix對比傳統(tǒng)服務(wù)器集群實現(xiàn)模型訓(xùn)練效率提升68%。
華為云還宣布業(yè)界首創(chuàng)EMS彈性內(nèi)存存儲正式發(fā)布。通過業(yè)界首創(chuàng)EMS-彈性內(nèi)存存儲,華為云助企業(yè)打破AI內(nèi)存墻,釋放極致算力。
04.盤古5.0技術(shù)首揭秘:三大類技術(shù)優(yōu)化,推出新模型架構(gòu)π
華為云首次公布揭秘盤古5.0誕生的背后技術(shù),涉及數(shù)據(jù)高效、效率高效、參數(shù)高效三大方面。在數(shù)據(jù)高效方面,基于兩大關(guān)鍵技術(shù)——數(shù)據(jù)合成和數(shù)據(jù)課程學(xué)習(xí),華為云提升數(shù)據(jù)利用率,試用優(yōu)質(zhì)的數(shù)據(jù)激活盤古5.0模型更多的能力。
同時,華為云推出了昇騰親和的新模型架構(gòu)——π。一方面團(tuán)隊基于增廣殘差連接的模型增強,緩解特征坍塌;另一方面,基于級數(shù)激活函數(shù)的非線性增強,使得模型與昇騰架構(gòu)更友好。
面對大集群訓(xùn)練千億稠密大模型,技術(shù)挑戰(zhàn)在于大集群訓(xùn)練如何提升算力利用率,華為云通過多副本并行+計算通信流水,以及大集群調(diào)度與通信優(yōu)化,使得隱藏通信降低70%,通信和等待時間從30%降至10%。在多模態(tài)上,團(tuán)隊主要做了兩大關(guān)鍵技術(shù),一是統(tǒng)一視覺編碼器,二是采用動態(tài)分辨率,從而克服當(dāng)下編碼器無法兼顧自然圖像和文檔圖表的問題。
在強思維,也就是復(fù)雜推理方面,華為云通過MindStar技術(shù),圍繞多步生成+策略搜索兩大關(guān)鍵方法,從而將模型的推理能力提高30分,使得百億模型達(dá)到千億模型的能力。
05.生產(chǎn)線大升級,用大模型重塑華為云服務(wù)
工欲善其事,必先利其器,華為云還用大模型重塑了其多條生產(chǎn)線。在模型開發(fā)方面,華為云ModelArts studio大模型即服務(wù)平臺支持便捷大模型開發(fā)與應(yīng)用,通過0代碼、免配置完成模型開發(fā)與微調(diào),通過多模型智能路由降低模型調(diào)用成本超25%,沉淀50+智能代理,賦能RPA、政務(wù)、會議等多個方面的企業(yè)內(nèi)部助手。
繼去年接入大模型后,今年華為云通過結(jié)合AI Agent能力,將CodeArts軟件開發(fā)生產(chǎn)線從單點智能升級到項目級智能。相比業(yè)界主流方案,CodeArts在問題定位率上提升了73%,項目級問題修復(fù)成功率提升了57%,讓開發(fā)者能輕松實現(xiàn)項目級智能。
在數(shù)據(jù)治理方面,華為云DataArts數(shù)據(jù)治理生產(chǎn)線也實現(xiàn)升級,將盤古大模型和華為18年的數(shù)據(jù)治理經(jīng)驗相結(jié)合,一是將沉淀在企業(yè)海量數(shù)據(jù)中的業(yè)務(wù)規(guī)則、決策流程、行業(yè)經(jīng)驗發(fā)掘出來,形成企業(yè)知識湖;二是基于大模型,實現(xiàn)數(shù)據(jù)集成、開發(fā)、治理、分析等生命周期的自動化、智能化,從而降低智能化管數(shù)、用數(shù)的門檻。
在MetaStudio數(shù)字內(nèi)容生產(chǎn)線方面,華為云將多模態(tài)大模型和生成式AI技術(shù)相結(jié)合,基于800多萬小時的音視頻數(shù)據(jù)和3000多萬的3D資產(chǎn),打造了盤古媒體大模型;將盤古媒體大模型和華為有深厚積累的音視頻編解碼、3D模型物理仿真等結(jié)合用于AI內(nèi)容生成,突破了當(dāng)前大模型不懂物理世界的局限。
在數(shù)據(jù)庫方面,華為云將產(chǎn)品文檔、專家知識、運維經(jīng)驗等數(shù)據(jù)庫專業(yè)數(shù)據(jù)和大模型相結(jié)合,構(gòu)建盤古數(shù)據(jù)庫大模型,實現(xiàn)了GaussDB數(shù)據(jù)庫的開發(fā)、測試、遷移、運維的全生命周期智能化,提升開發(fā)人員和DBA的使用效率。在安全方面,華為云用盤古大模型升級華為云安全服務(wù),打造了面向安全領(lǐng)域的盤古安全大模型,學(xué)習(xí)了華為云每年4500億次攻擊對抗的攻防經(jīng)驗,600多次的護(hù)網(wǎng)演練流程腳本,和400多個行業(yè)的攻擊場景等數(shù)據(jù),讓華為云能夠快速、精準(zhǔn)的給出安全治理咨詢的專業(yè)意見。
06.結(jié)語:華為云AI原生布局初現(xiàn),盤古5.0將大模型深扎行業(yè)
今日,中國人迎來了自己的操作系統(tǒng),純血鴻蒙正式發(fā)布,與此同時華為原生智能AI的大招炸場,背后則是華為云盤古5.0大模型的硬核支持。去年,華為云在盤古3.0發(fā)布時提出“不作詩,只做事”,今年隨著盤古5.0的發(fā)布,華為云提出“不僅要做事,還要做最難的事”,從三大技術(shù)更新到行業(yè)大模型,從車間到工地,盤古大模型正在融入更多行業(yè)解決實際難題。當(dāng)下,如火如荼的“百模大戰(zhàn)”拼價格、比參數(shù)、刷榜單,競賽到了白熱化階段。但與此同時,大模型是不是同質(zhì)化了、停留在GPT-3.5水平了?引起產(chǎn)業(yè)人思考。華為云為大模型的中國方案給出了新思路,通過與千行百業(yè)的實際問題結(jié)合,大模型有望在實踐中迸發(fā)新的生命力。