除了“ChatGPT之父”奧特曼被OpenAI董事會罷免之外,剛剛過去的這幾天,有關(guān)大模型的消息多次刷屏。先是馬斯克旗下人工智能初創(chuàng)公司xAI推出首款人工智能模型Grok,公開叫板OpenAI,再是OpenAI轉(zhuǎn)身甩出一個“王炸”,GPT-4 Turbo、自定義GPT以及GPT商店接連登場,令整個業(yè)界為之震撼。緊接著,一場DDoS攻擊導致ChatGPT發(fā)生全球大宕機,不得不宣布推遲新功能上線時間,并暫停新的ChatGPT Plus注冊。
國內(nèi)大模型市場也是一片沸騰。招聯(lián)金融、馬上消費等連番發(fā)布金融大模型;OPPO、小米、vivo等紛紛官宣大模型“上機”;美的、長虹、TCL等家電品牌下場自研大模型......“模型熱”正酣之時,百度CEO李彥宏卻直言“國內(nèi)大模型太多、應用太少”,再度引發(fā)熱議?!熬怼逼饋淼腉PT生態(tài)圈背后是對大模型未來的思索。
馬斯克“Grok”對戰(zhàn)“ChatGPT”勝算幾何?
馬斯克的高調(diào)加入無疑會讓大模型之爭進一步升級。業(yè)內(nèi)人士猜測,馬斯克選擇在這個時間點發(fā)布模型,是為了“對抗”O(jiān)penAI。不過,相較之下,Grok的入局晚了不少,勝算幾何尚難評估。
OpenAI最近舉辦的首次開發(fā)者大會賺足了眼球,比如全新升級的GPT-4 Turbo支持128k上下文,價格卻降低了2/3,沖擊了現(xiàn)有的商用服務價格;新推出的GPTs將大模型從技術(shù)推向了商業(yè)化,這對產(chǎn)業(yè)發(fā)展而言是至關(guān)重要的一步。
OpenAI創(chuàng)始人Sam Altman對ChatGPT至今的成就進行了回顧。他提到:“到目前為止,我們已經(jīng)擁有大約200萬的開發(fā)者,他們在我們提供的API上構(gòu)建了各種各樣的應用,并取得了令人驚嘆的成果。超過92%的世界500強企業(yè)都在使用我們的產(chǎn)品作為基礎。此外,我們的周活躍用戶數(shù)量已經(jīng)達到了約1億?!边@些數(shù)據(jù)意味著OpenAI在構(gòu)建大模型商業(yè)閉環(huán)的過程中,已經(jīng)成功地吸引了最有付費意愿和需求的客戶群體。
不過,ChatGPT也并非十全十美。北京計算機學會數(shù)字經(jīng)濟專委會秘書長王娟向《中國電子報》記者表示:“ChatGPT對新生事物認知有盲點和漏洞,很多測試開始給模型‘喂數(shù)據(jù)’誘導結(jié)果,大模型也有脫軌的時候?!?/p>
“生成式AI的市場應用依然處于早期階段,一切皆有可能,”Forrester副總裁、研究總監(jiān)戴鯤在接受《中國電子報》記者采訪時分析稱,“xAI的商業(yè)版圖融合了大模型、社交平臺、自動駕駛與腦機接口等不同領域,差異化的生態(tài)能力為Grok的未來發(fā)展提供了獨具特色的發(fā)展可能?!?/p>
根據(jù)已經(jīng)公布的一些測試數(shù)據(jù),Grok在GSM8k(中學數(shù)學單詞)、MMLU(多學科多項選擇)、HumanEval(代碼完成)、MATH(初高中數(shù)學)等多項數(shù)學和推理能力的基準測試中性能均優(yōu)于GPT-3.5,雖然距離GPT-4還有或多或少的距離,但作為第一次正式發(fā)布的公測版本,Grok-1已經(jīng)有非常顯著的進展。
而在訓練數(shù)據(jù)方面,GPT-4在訓練數(shù)據(jù)的廣度和深度方面都具備顯著的先發(fā)生態(tài)優(yōu)勢,也可以在調(diào)用時實時搜索Web數(shù)據(jù),這是Grok所不具備的。Grok的差異化優(yōu)勢在于它可以更有效地訪問X平臺(即之前的Twitter)的信息,這賦予了Grok實時社交平臺數(shù)據(jù)洞察及多樣化的生成風格。
“巨量、實時且獨特的數(shù)據(jù)是該模型的基礎,可以實時從推文中獲取最新知識,主打一個實時性,也就是說這個模型在不斷學習和更新。同時,Grok有著不走尋常路的幽默模式語言風格,馬斯克的個人風格在其中凸顯,開發(fā)語言是Rust以及深度學習框架新秀JAX,分布式的架構(gòu)讓系統(tǒng)避免了大模型的系統(tǒng)性風險?!蓖蹙瓯硎尽?/p>
“Grok的定位并不一定是GPT的競品,GPT定位是全場景的AI平臺,Grok更多是適合X的大模型應用平臺,兩者的定位不一樣。Grok是一個不錯的補充?!遍_放原子開源基金會TOC主席譚中意對《中國電子報》記者說道。
GPT生態(tài)選擇題:開源還是閉源?
無論是Grok與OpenAI的對決,還是國內(nèi)各種大模型的比拼,想要突出重圍,生態(tài)建設是重中之重。這也是OpenAI、阿里云、騰訊等廠商著急做模型商店的根本原因。
“OpenAI的模型商店從理念上與國內(nèi)大部分廠商的戰(zhàn)略規(guī)劃是一致的,都希望通過模型商店的方式打造生態(tài),一方面便于中小廠商引流,一方面更利于客戶選擇和開發(fā)人員與廠商協(xié)作,以此實現(xiàn)圍繞GPT大模型更強的黏性,最終推動營收的增長。”戴鯤說道。
但同時他也指出,由于廠商自身的市場定位與發(fā)展戰(zhàn)略不同,模型的覆蓋、模型被集成的機制、面向的客戶群體、針對的行業(yè)細分與商業(yè)場景、對底層云平臺的選擇、與相關(guān)云服務的集成、計量計費、許可與定價模式等各個方面肯定會存在差異。
“雖然都要做模型商店,但OpenAI要做的模型商店和騰訊、阿里等要做的模型商店差異很大。騰訊、阿里云提供的是MAAS服務(模型即服務),它們的模型商店支持多種不同的模型(開源和閉源的模型都包括);OpenAI則是在其閉源的ChatGPT上提供各種定制化的服務,依賴于其提供的底層模型。”譚中意說道。
就像持續(xù)至今天的“iOS”和“安卓”之爭,大模型的生態(tài)建設同樣面臨開源還是閉源這道選擇題。譚中意認為:“OpenAI的ChatGPT是閉源的,Meta的Llama2是開源的。以后的大模型生態(tài),將是開源生態(tài)和閉源生態(tài)之間的競爭和合作同時并存?!?/p>
國內(nèi),百川智能大模型、智源AI大模型、騰訊混元大模型、阿里云通義千問大模型等都宣布加入開源的“大部隊”。而華為的盤古大模型、百度的文心一言等則選擇了閉源。
戴鯤指出,與傳統(tǒng)技術(shù)領域不同,大模型的開源包含多種不同層次,涉及模型架構(gòu)、用于模型預訓練的代碼與超參數(shù)、完成預訓練的模型權(quán)重與參數(shù)、用于模型評估的輸入數(shù)據(jù)預處理代碼與模型評估代碼、全過程配置與開發(fā)文檔、API與插件接口、許可證方式等。保持開放的接口與插件體系、搭配開放的文檔與有限開源的商業(yè)許可是必然的選擇,而其他層次的開源與否可以根據(jù)市場發(fā)展動態(tài)選擇。
“模型商店帶來的將是更加廣泛的數(shù)據(jù)和商業(yè)模式。如果開源能夠提供閉源所不能替代的活躍度,同時促進開發(fā),當然很好。但如果只是增加了短期的應對負荷和同質(zhì)化產(chǎn)品競爭,對技術(shù)和商業(yè)價值都沒有太大意義,閉源就很好?!蓖蹙暾f道。同時她指出,OpenAI至少目前的目的不是純粹的商業(yè)化。騰訊、阿里的模型商店是要用模型盈利和定價帶動應用層的配套,以及云和硬件產(chǎn)業(yè)鏈市場。
百川智能創(chuàng)始人、CEO王小川表示,未來開源和閉源會像蘋果和安卓系統(tǒng)一樣并行發(fā)展。大部分服務會依賴開源模型,而閉源會提供特定的增值服務。開源模型提供80%,最后靠閉源提供剩下20%服務。
模型生態(tài)究竟應該怎么建?
發(fā)展至今,無論是通用大模型還是行業(yè)垂直大模型,賽道上都已擠滿了各類玩家,有互聯(lián)網(wǎng)科技公司,有AI技術(shù)公司,還有手機廠商、家電廠商、金融機構(gòu)、文娛公司、教育機構(gòu)等跨界選手。這反映出業(yè)界對大模型抱有極大的熱情與信心,但同時也表明產(chǎn)業(yè)尚未形成一個真正具備吸引力和競爭力的模型生態(tài)。
談及構(gòu)建模型生態(tài)的關(guān)鍵要素,戴鯤表示,模型自身的能力、廠商的平臺化能力和生態(tài)運營能力,三者缺一不可。首先,模型要有卓越的性能、出色的多模態(tài)支持、良好的開放性與快速迭代、良好體驗的開發(fā)環(huán)境、完善的文檔與案例等;其次,廠商必須具備平臺化能力,比如涵蓋公有云、私有云與邊緣云在內(nèi)的服務于ModelOps的全棧云原生能力平臺化,圍繞模型的人工智能平臺與數(shù)據(jù)管理的全生命周期平臺化,面向各行業(yè)細分業(yè)務場景進行模型定制的平臺化,以及涵蓋從底層芯片到開發(fā)和上層應用的軟硬件適配平臺化等;此外,廠商還需具備生態(tài)運營的能力,比如對國內(nèi)、國際開源社區(qū)與產(chǎn)業(yè)聯(lián)盟的貢獻與影響,從模型開發(fā)到工程實踐對開發(fā)人員的有效支持以及企業(yè)業(yè)務與技術(shù)決策者的思想領導力等。
“頭部廠商積累的數(shù)據(jù)客觀上形成模型生態(tài)的競爭基礎,所以在生態(tài)建設方面,字節(jié)、騰訊、阿里這些企業(yè)的核心競爭力更具優(yōu)勢?!蓖蹙瓯硎?。實際上,模型并非越多越好,國內(nèi)現(xiàn)在大模型很熱,已有的大模型愿景大多都是做全產(chǎn)業(yè)鏈布局。很多看上去不錯的大模型,實際本身不僅不產(chǎn)生任何價值,還造成了算力、人力和財力的浪費。
根據(jù)專家預測,未來幾十年的大模型相關(guān)的產(chǎn)業(yè)形態(tài),首先是有幾家提供通用大模型服務的企業(yè),包括百度、阿里等;其次是多家企業(yè)提供行業(yè)大模型的服務,包括金融、能源、制造等行業(yè);最后是數(shù)百家甚至上千家技術(shù)企業(yè)提供企業(yè)內(nèi)部的私有化大模型服務,用于知識管理、軟件開發(fā)、供應鏈等具體場景。每家企業(yè)內(nèi)都會有很多大模型的服務,其中大部分是部署在企業(yè)內(nèi)部的私有化大模型服務,也有少部分是訪問公網(wǎng)大模型 API 服務。
“要建立不錯的生態(tài)環(huán)境,需要卓越的技術(shù)能力和商業(yè)能力,從國內(nèi)大模型廠商來看,百度相對而言技術(shù)實力比較靠前,騰訊和阿里云也有豐富的應用場景,都有不錯的前景?!弊T中意表示。不過,對比OpenAI,差距還是非常明顯的。比如中文數(shù)據(jù)集在數(shù)量上和質(zhì)量上還跟英文數(shù)據(jù)集有很大差距,算力也受到很大限制,架構(gòu)在大模型上的開發(fā)生態(tài)才剛剛開始。
“我們需要的大模型是一個能夠持續(xù)進化的大模型,是一個能在此基礎上產(chǎn)生健康生態(tài)(開發(fā)活躍、良性競爭、技術(shù)和商業(yè)都兼顧)的大模型,中國的大模型生態(tài)應該是閉源和開源互相競爭、互相合作的模式?!弊T中意表示。
作者丨宋婧,編輯丨趙晨
美編丨馬利亞,監(jiān)制丨連曉東