6月21日,華為開發(fā)者大會2024(HDC 2024)在東莞籃球中心隆重揭幕。華為攜手各領(lǐng)域客戶及伙伴,全面分享了HarmonyOS、盤古大模型、昇騰AI云服務(wù)、GaussDB數(shù)據(jù)庫等最新科技創(chuàng)新成果,以及如何以科技創(chuàng)新為驅(qū)動,在鴻蒙生態(tài)和大模型技術(shù)中心把握新機遇,構(gòu)建智慧未來的新商業(yè)藍圖。
在今天下午舉行的大會主題演講環(huán)節(jié)中,華為常務(wù)董事、華為云CEO張平安重磅發(fā)布盤古大模型5.0,在全系列、多模態(tài)、強思維三個方面帶來全新升級。
華為常務(wù)董事、華為云CEO張平安
全系列:盤古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場景。十億級參數(shù)的Pangu E系列可支撐手機、PC等端側(cè)的智能應(yīng)用;百億級參數(shù)的Pangu P系列,適用于低時延、高效率的推理場景;千億級參數(shù)的Pangu U系列適用于處理復(fù)雜任務(wù);萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。
多模態(tài):盤古大模型5.0能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高分辨率;在內(nèi)容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術(shù),聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。
例如,在多模態(tài)識別方面,盤古大模型5.0能夠識別衛(wèi)星遙感圖像,準確分析出區(qū)域農(nóng)作物的生長情況,用于產(chǎn)量預(yù)估、病蟲害監(jiān)測等。還能識別紅外影像,當夜間通過可見光無法看清的時候,盤古5.0能夠通過紅外影像精準的識別車輛的位置,進行交通違停的管理;此外,盤古5.0能夠通過可見光和雷達的影像綜合判斷該地區(qū)的植被覆蓋情況,幫助生態(tài)部門進行自然保護地的監(jiān)測。
在內(nèi)容生成方面,在自動駕駛領(lǐng)域,盤古大模型5.0通過創(chuàng)新的可控時空生成技術(shù),結(jié)合場景視頻生成、4D BEV視頻生成、自動駕駛仿真庫及路網(wǎng)信息,能更好地理解物理規(guī)律,大規(guī)模生成和實際場景相一致的駕駛視頻數(shù)據(jù),還可以靈活增加控制條件,生成不同路況、不同光照、不同天氣的訓練視頻數(shù)據(jù),加速自動駕駛技術(shù)的快速成熟。
強思維:復(fù)雜邏輯推理是大模型成為行業(yè)助手的關(guān)鍵。盤古大模型5.0將思維鏈技術(shù)與策略搜索深度結(jié)合,極大地提升了數(shù)學能力、復(fù)雜任務(wù)規(guī)劃能力以及工具調(diào)用能力。
例如,在一道立體幾何題中,需要證明圖中的直線PQ與三棱柱的側(cè)面平行。盤古大模型5.0可以將輸入的2D圖片在3D空間中進行推理,首先給出了正確的解題思路,并通過思維鏈多步生成和策略搜索,一步一步完成題目的證明。
除了盤古大模型5.0的全新升級,張平安還分享了盤古大模型在工業(yè)設(shè)計、建筑設(shè)計、具身智能、媒體生產(chǎn)和應(yīng)用、高鐵、鋼鐵、氣象等領(lǐng)域的豐富創(chuàng)新應(yīng)用和落地實踐,持續(xù)深入行業(yè)解難題。
在工業(yè)設(shè)計領(lǐng)域,以新車造型設(shè)計為例,周期一般需要1-2年,盤古大模型可以讓汽車的造型設(shè)計時間大幅縮短。造型設(shè)計師可以將自己的靈感,通過對話、畫圖與大模型交互,生成3D汽車數(shù)字模型,并可進行風格化調(diào)整、零部件編輯、顏色更換等。盤古大模型生成的數(shù)字模型還可直接輸出成3D文件,支持10幾種主流格式,設(shè)計師可以直接3D打印成樣品,減少制作油泥模型的輪次,極大地節(jié)省成本和時間。
除了汽車造型設(shè)計,盤古大模型還可以用于汽車的工裝設(shè)計、模具設(shè)計,以及電子產(chǎn)品領(lǐng)域的工業(yè)設(shè)計等。華為云與東莞市政府共同打造了東莞市人工智能大模型中心,希望讓當?shù)馗嗟碾娮又圃祛惼髽I(yè)使用到盤古大模型的工業(yè)設(shè)計服務(wù)。
在建筑設(shè)計領(lǐng)域,基于盤古大模型的可控生成能力,只需輸入設(shè)計的黑白草圖,即可生成彩色并帶有紋理的建筑群360°實景視頻;基于盤古3D重建能力,還可以構(gòu)建出高真實感的建筑3D模型,將復(fù)雜建筑群的概念設(shè)計周期從數(shù)周縮短到數(shù)十分鐘,助力建筑師創(chuàng)造出更加出色的建筑作品。
在具身智能領(lǐng)域,盤古大模型能夠讓機器人完成10步以上的復(fù)雜任務(wù)規(guī)劃,并且在任務(wù)執(zhí)行中實現(xiàn)多場景泛化和多任務(wù)處理。同時盤古大模型還能生成機器人需要的訓練視頻,讓機器人更快地學習各種復(fù)雜場景。
在媒體內(nèi)容生產(chǎn)和應(yīng)用領(lǐng)域,盤古大模型能夠?qū)嵟囊曨l快速轉(zhuǎn)換成特定風格的動漫,并保持角色樣貌特征前后一致,舞蹈、武打等大運動軌跡也能確保合理一致的視覺效果;能自動將視頻譯制成不同語言,并保留原始角色的音色、情感、語氣;將譯制配音、動漫生成等場景的制作周期從月級縮短到天級,大大提升制作效率,作品一次拍攝多元化制作,實現(xiàn)價值最大化;還能通過AI翻譯和擬人化語音合成能力,實現(xiàn)AI同聲傳譯,讓云會議、視頻通話等可以實現(xiàn)母語交流體驗。
在鐵路領(lǐng)域,全國每天需要檢測的動車大概有3.2萬節(jié)車廂,過去需要大量的巡檢工人在凌晨時段去完成,耗時耗力。如今結(jié)合盤古大模型和巡檢機器人,可精準識別一列動車的3.2萬個項點,覆蓋8大類、350多種復(fù)雜故障,幫助高鐵提升運營效率,降低成本,減少人工在凌晨時段去巡檢的艱辛作業(yè)。
在鋼鐵領(lǐng)域,以上海寶武鋼鐵熱軋生產(chǎn)線為例,每次調(diào)整生產(chǎn)鋼板的種類和尺寸,都需要工程師重新調(diào)整7道精軋機組的300多個參數(shù),需要耗費約5天的時間。盤古大模型能夠?qū)ψ顑?yōu)參數(shù)進行預(yù)測,顯著降低熱軋生產(chǎn)線調(diào)優(yōu)時間,并提高預(yù)測精度和鋼板成材率。目前盤古大模型目前已在寶鋼1880熱軋生產(chǎn)線上線,預(yù)測精度提高5%以上,鋼板成材率提升0.5%,預(yù)計每年可以多產(chǎn)鋼板2萬余噸,年收益達9000余萬元。此外,盤古大模型還將應(yīng)用于高爐場景,對爐溫、鐵水溫度、硅含量等爐況進行仿真,從而輔助高爐精準控制,充分利用每一分能源,降低能源成本。
在氣象領(lǐng)域,華為云聯(lián)合深圳市氣象局,在分辨率為25公里的全球模型基礎(chǔ)上,融合區(qū)域高質(zhì)量氣象數(shù)據(jù)集,升級了分辨率分別為1公里、3公里、5公里的區(qū)域預(yù)報能力,包含氣溫、降雨、風速等氣象要素。不僅如此,今年華為云還聯(lián)合天融環(huán)境打造了環(huán)境大模型,將污染六項的預(yù)測準確度全面提升10%以上。
在醫(yī)藥領(lǐng)域,天士力基于盤古大模型打造“數(shù)智本草大模型”。一方面基于盤古L0能力,學習訓練了378萬篇文獻等數(shù)據(jù),尤其是學習了1000多本古籍,從古方古籍和現(xiàn)代文獻中總結(jié)出知識和經(jīng)驗,可以賦能方劑篩選和優(yōu)化、提升研發(fā)效率,也能輔助醫(yī)生問診。另一方面,天士力在盤古17億化合物的藥物分子大模型基礎(chǔ)上,增訓了350萬天然產(chǎn)物分子數(shù)據(jù),未來有望更好地優(yōu)化方劑和發(fā)現(xiàn)新藥。
除了盤古大模型的創(chuàng)新升級,華為云還對昇騰AI云服務(wù)進行持續(xù)優(yōu)化。業(yè)界萬億參數(shù)模型訓練的平均無中斷時長約2.8天,昇騰AI云服務(wù)可實現(xiàn)40天無中斷;業(yè)界平均集群故障恢復(fù)時間約60分鐘,昇騰AI云服務(wù)可以縮短到10分鐘,同時能將大模型的資源開通時間從月級縮短到天級,加速大模型的開發(fā)。目前昇騰AI云服務(wù)已全面適配行業(yè)主流的100多個大模型,以云服務(wù)的方式協(xié)助客戶開發(fā),訓練,托管和應(yīng)用模型,打造百模千態(tài)的“黑土地”。
張平安強調(diào),一直以來,華為云盤古大模型都堅定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅克難,砥礪前行,重塑千行萬業(yè)。華為云將與所有的客戶、伙伴和開發(fā)者一起,創(chuàng)新不止,攀登不止,讓云無處不在,讓智能無所不及,加速千行萬業(yè)的智能升級。