OpenAI o1發(fā)布之后,復(fù)雜邏輯推理能力驚艷業(yè)界,數(shù)理能力達(dá)到博士水平。比如此前一直困擾LLMs的“9.9和9.11誰(shuí)更大”問(wèn)題,就在o1時(shí)代得到了解決。
于是有了一種說(shuō)法:這一輪AI浪潮,中國(guó)越追趕越落后,跟OpenAI的差距越來(lái)越大。
現(xiàn)實(shí)情況真的如此嗎?我們不必急著下結(jié)論,不妨一起來(lái)思考三個(gè)問(wèn)題:
近年來(lái)以大模型為主的通往AGI之路,究竟是怎么發(fā)展的?
中國(guó)AI在世界一流技術(shù)路線上到底發(fā)展到哪一步了?
以及面對(duì)o1,國(guó)產(chǎn)AI能應(yīng)對(duì)嗎、怎么應(yīng)對(duì)?
兩年、三條路:OpenAI畫(huà)出的AGI路線圖
毋庸置疑,OpenAI此前一直稱(chēng)得上是AI技術(shù)創(chuàng)新的“火車(chē)頭”。從ChatGPT至今,OpenAI用一個(gè)又一個(gè)模型證明了,通往AGI的三個(gè)技術(shù)方向:
1.GPT路線。從ChatGPT到GPT 4o,這一路線的核心是用模型對(duì)token流進(jìn)行統(tǒng)計(jì)建模的通用技術(shù),token可以是文本、圖像、音頻、動(dòng)作選擇、分子結(jié)構(gòu)等。最新的4o就是多模態(tài)融合的代表。有業(yè)內(nèi)專(zhuān)家表示,這一路線更貼切的名字可能是“Autoregressive(自回歸)Transformer”之類(lèi)的。
2. Sora路線。Sora和GPTs一樣,都使用了Transformer架構(gòu),為什么單獨(dú)作為一支呢?因?yàn)檎宫F(xiàn)了一種對(duì)現(xiàn)實(shí)世界復(fù)雜現(xiàn)象的建模能力。圖靈獎(jiǎng)得主、Meta公司首席科學(xué)家楊立昆(Yann LeCun)認(rèn)為,Sora可能是擺脫了人類(lèi)專(zhuān)家所謂的一些知識(shí)干預(yù)后,更接近世界本源的,更準(zhǔn)確的一種建模方式。
3. o1路線。GPTs也好,Sora也好,都是概率模型,以損失推理效率為代價(jià),因此理論上永遠(yuǎn)會(huì)出現(xiàn)偏差,具體表現(xiàn)為“幻覺(jué)”、不可靠性。怎么讓模型具備真正的邏輯推理能力呢?o1路線通過(guò)Inference 的方法,基于強(qiáng)化學(xué)習(xí)(RL)能力,使用CoT思維鏈將復(fù)雜問(wèn)題拆解,并讓多個(gè)子模型來(lái)協(xié)作解決,相當(dāng)于復(fù)雜Prompt的自動(dòng)化,極大地提高了模型的推理能力,確實(shí)在LLMs難以搞定的數(shù)理問(wèn)題和復(fù)雜任務(wù)上有很好的表現(xiàn)。
不難看到,兩年以來(lái)OpenAI引領(lǐng)的三個(gè)方向,只要目標(biāo)明確,中國(guó)AI都是可以攻下的。目前,國(guó)產(chǎn)類(lèi)GPT和類(lèi)Sora模型,無(wú)論是底層架構(gòu)、具體技術(shù)、落地產(chǎn)品,其實(shí)并不遜色于OpenAI的模型,很快就縮小了技術(shù)代差。
這也說(shuō)明了一件事,每一次OpenAI明確了方向,結(jié)果并不是“越追趕越落后”,反而可以讓中國(guó)AI聚焦并集中資源,進(jìn)行有效研發(fā),進(jìn)一步縮小差距。
具體到o1,我們認(rèn)為也將延續(xù)上述走向,國(guó)產(chǎn)AI很快會(huì)完成突破。那么,目前業(yè)界準(zhǔn)備得怎么樣了呢?
組團(tuán)突圍:國(guó)產(chǎn)AI集結(jié)在CoE周?chē)?/h2>
“在通往AGI的路上,已經(jīng)沒(méi)有任何阻礙”,這句話來(lái)形容o1的意義,并不夸張。如此跨越式的突破,國(guó)產(chǎn)AI真的做好準(zhǔn)備了嗎?我們深入技術(shù)本質(zhì),去追根溯源。
OpenAI聯(lián)合創(chuàng)始人、科學(xué)家Greg Brockman,在博客中剖析了o1的底層邏輯。他寫(xiě)道:OpenAI o1是我們第一個(gè)通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的模型,在回答問(wèn)題之前會(huì)深入思考。模型進(jìn)行系統(tǒng) I 思考,而思維鏈則解鎖了系統(tǒng) II 思考,可以產(chǎn)生極其令人印象深刻的結(jié)果。
所謂系統(tǒng) II 思考,指的是人腦依賴(lài)邏輯和理性分析,進(jìn)行的慢速?gòu)?fù)雜推理??梢耘c負(fù)責(zé)快速直覺(jué)決策的系統(tǒng) I 相互配合,來(lái)實(shí)現(xiàn)更好的模型性能。
360集團(tuán)創(chuàng)始人周鴻祎則表示,OpenAI o1遵循的可能是“雙系統(tǒng)理論 Dual Process Theory”,核心在于兩種系統(tǒng)并非獨(dú)立而是協(xié)同運(yùn)作。由此推測(cè),其內(nèi)部構(gòu)建的更加智能的模型或許是 GPT和o系列結(jié)合思維鏈的融合系統(tǒng),前者用于“快思考”,后者實(shí)現(xiàn)“慢思考”。而CoE(Collaboration-of-Experts,專(zhuān)家協(xié)同)架構(gòu)則集合了數(shù)量更多的大模型和專(zhuān)家模型,是通過(guò)思維鏈和“多系統(tǒng)協(xié)同”的方式實(shí)現(xiàn)“快思考”和“慢思考”。
熟悉國(guó)內(nèi)AI的讀者可能發(fā)現(xiàn)了,“慢思考”這個(gè)說(shuō)法怎么這么眼熟呢?
沒(méi)錯(cuò),如何提升機(jī)器的認(rèn)知智能是AI界長(zhǎng)盛不衰的話題,而“慢思考”這個(gè)創(chuàng)意也并非OpenAI獨(dú)創(chuàng)。早在今年7月底舉辦的ISC.AI2024大會(huì)上,周鴻祎就提過(guò),360將“用基于智能體的框架打造慢思考系統(tǒng),從而增強(qiáng)大模型的慢思考能力,把多個(gè)大模型組合起來(lái)解決業(yè)務(wù)問(wèn)題”。
所以,大家可以放心的是,在技術(shù)創(chuàng)新高度依賴(lài)全球智力碰撞的今天,沒(méi)有一種技術(shù)思路是可以被壟斷的,甚至中國(guó)AI界提出“慢思考”更早。
當(dāng)然,大家可能擔(dān)心的是,理念先進(jìn)是一回事,是否具有相應(yīng)的工程能力,打造出一個(gè)基于系統(tǒng)II思考的模型又是另一回事。具體到產(chǎn)品上,國(guó)產(chǎn)AI是否已經(jīng)做好打造類(lèi)o1模型的準(zhǔn)備呢?我認(rèn)為,三個(gè)條件已經(jīng)具備了:
1. 路線一致。模型的底層框架,是長(zhǎng)期積累、厚積薄發(fā)的結(jié)果,國(guó)內(nèi)360就和o1的技術(shù)架構(gòu)保持著一致性。360首創(chuàng)的CoE架構(gòu)8月1日正式發(fā)布,所謂CoE,就是Collaboration-of-Experts,專(zhuān)家協(xié)同,讓多個(gè)模型分工協(xié)作、并行工作,執(zhí)行多步推理。CoE架構(gòu)與o1的理念一致、方法類(lèi)似,卻比o1發(fā)布的時(shí)間更早,足以證明國(guó)產(chǎn)AI在技術(shù)方向上并沒(méi)有落后,早已開(kāi)始探索。
2. 產(chǎn)品落地。目前o1仍是preview預(yù)覽版本,用戶(hù)體驗(yàn)的實(shí)際效果與官方用例有差距,而且使用也受到限制,o1-mini對(duì)ChatGPT Plus用戶(hù)的每周限制為50個(gè)提示詞。技術(shù)再好,用不到也是“期貨”。這一點(diǎn)上,國(guó)產(chǎn)AI的產(chǎn)品化優(yōu)勢(shì)就體現(xiàn)出來(lái)了,比如CoE架構(gòu)已經(jīng)在360AI搜索中落地應(yīng)用,讓AI搜索在面對(duì)不確定或復(fù)雜輸入時(shí)表現(xiàn)出更好的穩(wěn)定性,輸出更準(zhǔn)確、更具有時(shí)效性和權(quán)威性的內(nèi)容?;贑oE架構(gòu)的360AI搜索,也超越Perplexity AI,快速成長(zhǎng)為全球最大的AI原生搜索引擎,并且還在以月增速113%的極高速度成長(zhǎng)。
此外,360AI瀏覽器的AI助手,也可以非常直觀地讓用戶(hù)體會(huì)到模型競(jìng)技場(chǎng)、多模型協(xié)作等功能。由于CoE架構(gòu)已經(jīng)接入了百度、騰訊、阿里巴巴、智譜AI、Minimax、月之暗面等 16 家國(guó)內(nèi)主流大模型廠商合作打造的 54 款大模型產(chǎn)品,用戶(hù)可以任意選擇3款大模型,進(jìn)行多模型協(xié)作,以此達(dá)成比單個(gè)大模型回答問(wèn)題好得多的效果。第一個(gè)做專(zhuān)家,對(duì)提問(wèn)進(jìn)行第一輪回答;第二個(gè)做反思者,對(duì)專(zhuān)家的回答進(jìn)行糾錯(cuò)和補(bǔ)充;第三個(gè)做總結(jié)者,對(duì)前兩輪回答進(jìn)行優(yōu)化總結(jié)。在很多的實(shí)測(cè)例子中,第一個(gè)專(zhuān)家模型即使回答錯(cuò)誤,反思模型和總結(jié)模型都能夠在后續(xù)的協(xié)作過(guò)程中修正,與人類(lèi)在做出重要決策的思維活動(dòng)很像。
3.能力領(lǐng)先。可能還會(huì)有人問(wèn),國(guó)產(chǎn)大模型在數(shù)據(jù)、算法、算力上和Open AI都還有差距,這是實(shí)際情況,CoE“人多力量大”真的能趕上o1嗎?這一點(diǎn),我們可以用實(shí)測(cè)來(lái)檢驗(yàn)一下。
用業(yè)內(nèi)著名的復(fù)雜邏輯推理題,比如假期調(diào)休題、9.9和9.11比大小等問(wèn)題,同時(shí)詢(xún)問(wèn)GPT-4o、o1-preview、360AI瀏覽器,會(huì)發(fā)現(xiàn)360的多模型協(xié)作,可以集各家所長(zhǎng),確實(shí)能起到“組團(tuán)”打怪的效果。比如問(wèn)“我爺爺?shù)男值艿膬鹤拥睦掀诺拿妹玫膬鹤?,是我的什么”?60多模型和O1-preview都答對(duì)了,而4o 答錯(cuò)。眾人拾柴火焰高,多模型協(xié)作力量大的優(yōu)勢(shì)又一次得到了驗(yàn)證。
總的來(lái)說(shuō),國(guó)產(chǎn)AI通過(guò)CoE架構(gòu)進(jìn)行協(xié)同,表現(xiàn)確實(shí)大多優(yōu)于4o,與o1互有勝負(fù)。目前只是起點(diǎn),CoE這個(gè)路線被驗(yàn)證可行,未來(lái)隨著思維鏈、慢思考、協(xié)作模式帶來(lái)模型推理能力的大幅提升,國(guó)產(chǎn)混合模型的能力也可能逐漸媲美o1。
所以,他強(qiáng)由他強(qiáng),清風(fēng)拂山岡。OpenAI o1的確拆除了AGI路上的阻礙,但國(guó)產(chǎn)AI也并沒(méi)有臨淵羨魚(yú),而是早已織好了網(wǎng),集結(jié)在CoE這一路線。
向前一步:率先邁過(guò)產(chǎn)品化、商業(yè)化的門(mén)檻
難道國(guó)產(chǎn)AI永遠(yuǎn)都只能跟在OpenAI身后亦步亦趨,做一個(gè)追隨者嗎?
當(dāng)然不是。中美AI的場(chǎng)景不同、產(chǎn)業(yè)稟賦不同、技術(shù)落地土壤不同,也造就了各自的優(yōu)勢(shì)所在。
誠(chéng)然,OpenAI每一次都是新方向的開(kāi)拓者、領(lǐng)頭人,但也可以發(fā)現(xiàn),Sora、o1都帶有“期貨”色彩,至少仍然難以被規(guī)模化使用。其中既有產(chǎn)品成熟度的問(wèn)題,也有成本高、企業(yè)落地難度大的挑戰(zhàn)。比如有AI創(chuàng)業(yè)公司用o1解決實(shí)際業(yè)務(wù)問(wèn)題時(shí),發(fā)現(xiàn)Token數(shù)極大,成本極高,幾乎無(wú)法在現(xiàn)有業(yè)務(wù)中長(zhǎng)期使用。有的創(chuàng)業(yè)公司為了平衡成本,甚至?xí)艞壥褂米钚掳姹镜哪P汀?/p>
這一點(diǎn)來(lái)看,o1也給了國(guó)產(chǎn)AI在自身優(yōu)勢(shì)上更進(jìn)一步的機(jī)會(huì),主要體現(xiàn)在:
1.基座模型的價(jià)值再次被肯定。此前頭部通用大模型廠商都多少進(jìn)入到了“卷不動(dòng)”的迷茫期,o1讓市場(chǎng)再次看到了基座模型的邏輯推理能力對(duì)于業(yè)務(wù)的價(jià)值是最關(guān)鍵的,是這一輪AI浪潮的核心,不容有失。這對(duì)于發(fā)力基座模型的廠商來(lái)說(shuō),是一個(gè)很好的消息,產(chǎn)業(yè)界和社會(huì)各界的信心進(jìn)一步增強(qiáng),有利于國(guó)產(chǎn)通用大模型繼續(xù)提高領(lǐng)先性。
2.技術(shù)產(chǎn)品化的優(yōu)勢(shì)被放大。相比Sora視頻生成、4o語(yǔ)音交互,o1的產(chǎn)品化路徑更不清晰,如何回收成本將是OpenAI的一大挑戰(zhàn)。這一點(diǎn)上,更重視大模型產(chǎn)品化、應(yīng)用化的國(guó)產(chǎn)AI,或許會(huì)為類(lèi)o1模型更快找到落地途徑。
以CoE架構(gòu)的產(chǎn)品化為例,落地產(chǎn)品360AI搜索,已經(jīng)實(shí)現(xiàn)了商業(yè)閉環(huán),商業(yè)化收入已經(jīng)覆蓋了對(duì)應(yīng)的推理成本。這是因?yàn)?,此前CoE模型就很重視在加快推理速度的同時(shí),降低API接口和Token的使用成本。
3. AI創(chuàng)新與智能經(jīng)濟(jì)的加速。“比起AGI更重視ROI”,國(guó)產(chǎn)AI的務(wù)實(shí)特點(diǎn),一度被認(rèn)為技術(shù)信仰不如OpenAI強(qiáng)大。但遠(yuǎn)大的AGI目標(biāo),是靠一個(gè)個(gè)行業(yè)的AI化支撐起來(lái)的,這也是這一輪AI浪潮不會(huì)再次化為泡沫的根本。那么,千行百業(yè)智能化就不得不談ROI,因?yàn)槠髽I(yè)引入AI都是有成本的,從這一點(diǎn)上,國(guó)產(chǎn)AI走得更扎實(shí)。今年國(guó)產(chǎn)大模型紛紛“提效降費(fèi)”,中小AI企業(yè)和開(kāi)發(fā)者的Token使用成本和創(chuàng)新成本都在下降。
在此基礎(chǔ)上,隨著CoE等類(lèi)o1模型的升級(jí),讓AI深入行業(yè)、解決具體業(yè)務(wù)問(wèn)題有了更大的價(jià)值,RL+CoT進(jìn)一步降低了Prompt提示工程的門(mén)檻,這為中國(guó)智能經(jīng)濟(jì)的增長(zhǎng),又打開(kāi)了一個(gè)新的周期。
總結(jié)一下,通往AGI和智能時(shí)代的道路沒(méi)有捷徑,中國(guó)AI要一步一個(gè)腳印去丈量。兩年、三條路證明了360等中國(guó)AI的先鋒隊(duì)已經(jīng)在新的技術(shù)路線上組隊(duì)出發(fā)。
凡走過(guò)的,必留下足跡;凡努力過(guò)的,必將收獲。從LLM到CoE,中國(guó)AI絕不會(huì)缺席這一輪技術(shù)浪潮。