編譯 |??汪越,編輯?|??Panken
GPT進展放緩,OpenAI撞上數(shù)據(jù)墻,努力尋找出路。
智東西11月11日消息,據(jù)The Information報道,OpenAI的GPT系列模型改進速度放緩,公司正調(diào)整策略以應(yīng)對這一挑戰(zhàn)。據(jù)OpenAI員工透露,下一代旗艦?zāi)P蚈rion已完成約20%的訓(xùn)練。Orion在語言任務(wù)上表現(xiàn)出色,但在編碼等方面未超越GPT-4,且運行成本偏高,提升幅度低于預(yù)期。此外,Orion在明年年初發(fā)布時,可能不會沿用傳統(tǒng)的“GPT”命名規(guī)則,而是采用新的命名方式。
Orion的開發(fā)暴露了高質(zhì)量文本數(shù)據(jù)短缺的問題。根據(jù)Scaling Law理論,模型性能應(yīng)隨數(shù)據(jù)量和算力的增加而提升。但高質(zhì)量數(shù)據(jù)的有限性已使Orion的訓(xùn)練效果受限,令Scaling Law的適用性受到質(zhì)疑。即便投入更多數(shù)據(jù)和算力,模型的提升速度也可能不再如前幾代那樣顯著。
為此,OpenAI成立了一個專門團隊,研究如何克服數(shù)據(jù)短缺的挑戰(zhàn),評估Scaling Law還能適用多久。
01.撞上數(shù)據(jù)墻,Orion在某些方面神似舊模型
據(jù)OpenAI員工透露,GPT改進速度放緩的重要原因是高質(zhì)量文本和其他數(shù)據(jù)的短缺。大語言模型(LLM)的預(yù)訓(xùn)練需要大量數(shù)據(jù)來建立模型對世界和概念的理解,確保其能完成寫作或編程等任務(wù)。然而,隨著現(xiàn)有數(shù)據(jù)源日益被充分利用,模型提升正面臨瓶頸。
為解決數(shù)據(jù)不足的問題,OpenAI已組建由前預(yù)訓(xùn)練負(fù)責(zé)人尼克·萊德(Nick Ryder)領(lǐng)導(dǎo)的團隊,致力于探索如何克服數(shù)據(jù)短缺以及Scaling Law在未來的適用性。Orion模型的部分訓(xùn)練數(shù)據(jù)源于AI生成的數(shù)據(jù),即由GPT-4等舊模型生成的合成數(shù)據(jù)。然而,這種方式可能導(dǎo)致Orion在某些方面呈現(xiàn)出舊模型的特征。OpenAI正通過其他方法優(yōu)化LLM處理任務(wù)的能力,例如要求模型從大量數(shù)學(xué)或編程問題樣本中學(xué)習(xí),并通過強化學(xué)習(xí)提升解題效率。此外,人工評估員還會對模型的編碼和問題解決表現(xiàn)進行評分,這種基于人類反饋的強化學(xué)習(xí)為模型優(yōu)化帶來重要支持。今年9月,OpenAI推出了推理模型o1。與傳統(tǒng)模型不同,o1在回答前“思考”時間更長,通過增加計算資源提升響應(yīng)質(zhì)量,顯示出“測試時計算”(Test-Time Compute)的效果。雖然o1的運行成本是普通模型的六倍,并且該模型的客戶群較為有限,但阿爾特曼認(rèn)為它將為科學(xué)研究和復(fù)雜代碼生成等領(lǐng)域帶來突破。
02.LLM發(fā)展平臺期,投資基礎(chǔ)設(shè)施效果存疑
據(jù)The Information報道,Meta CEO馬克·扎克伯格(Mark Zuckerberg)、阿爾特曼以及其他AI開發(fā)公司的首席執(zhí)行官均公開講過,當(dāng)前的技術(shù)仍未達到Scaling Law所設(shè)定的極限。這或許是包括OpenAI在內(nèi)的公司,仍在投入數(shù)十億美元建設(shè)大型數(shù)據(jù)中心的原因之一,以進一步提升預(yù)訓(xùn)練模型的性能。
然而,OpenAI研究員諾姆·布朗(Noam Brown)在上個月的TEDAI會議上分享說,開發(fā)更先進的模型可能在財務(wù)上變得不可持續(xù)。布朗提出質(zhì)疑:我們真的要花費數(shù)千億美元甚至更多來訓(xùn)練新的模型嗎?擴展的模式終究會達到瓶頸。
OpenAI仍在對其下一代模型Orion進行長時間的安全性測試。據(jù)公司員工透露,Orion在明年年初發(fā)布時,可能不會沿用傳統(tǒng)的“GPT”命名規(guī)則,而是采用新的命名方式。OpenAI官方對此并未做出評論。
一些已經(jīng)向AI開發(fā)商投資了數(shù)千萬美元的投資者們,也對LLM是否已經(jīng)開始趨于穩(wěn)定表示擔(dān)憂。
本·霍洛維茨(Ben Horowitz)是OpenAI的股東之一,同時還投資了Mistral和Safe Superintelligence等競爭對手。他曾談道,OpenAI一直在增加訓(xùn)練AI所需的GPU數(shù)量,但似乎并未獲得預(yù)期的智能改進。不過,他并未進一步詳細(xì)說明?;袈寰S茨的同事馬克·安德森(Marc Andreessen)談道,許多聰明的研究人員正在努力突破技術(shù)瓶頸,嘗試提高推理能力。
企業(yè)軟件供應(yīng)商Databricks的聯(lián)合創(chuàng)始人兼董事長Ion Stoica談道,LLM在某些方面可能已經(jīng)進入瓶頸期,但在其他方面仍在持續(xù)進步。Stoica說,他們的平臺允許應(yīng)用程序開發(fā)者評估不同的LLM,并且發(fā)現(xiàn)雖然AI在編碼和解決復(fù)雜的多步驟問題上持續(xù)改進,但在執(zhí)行一些通用任務(wù)(如分析文本情緒或描述醫(yī)療癥狀)時,能力似乎有所放緩。
Stoica還說,在常識性問題上,LLM的表現(xiàn)可能已經(jīng)接近極限。為了進一步提升模型的能力,公司需要更多的事實數(shù)據(jù),而合成數(shù)據(jù)的幫助則有限。
03.結(jié)語:強化學(xué)習(xí)提升模型表現(xiàn),持續(xù)投資保持競爭力
OpenAI正通過多方策略應(yīng)對當(dāng)前的技術(shù)瓶頸,尤其是在LLM面臨的高質(zhì)量數(shù)據(jù)短缺和性能提升困境。為了克服這些挑戰(zhàn),OpenAI不僅通過強化學(xué)習(xí)提升模型在數(shù)學(xué)和編程等特定任務(wù)中的表現(xiàn),還依賴于AI數(shù)據(jù)平臺Scale AI和LLM訓(xùn)練商Turing等初創(chuàng)公司來管理大量外包承包商,以支持訓(xùn)練過程。
雖然當(dāng)前AI基礎(chǔ)設(shè)施的投資回報尚不明顯,且在LLM訓(xùn)練過程中面臨巨大的財務(wù)壓力與技術(shù)挑戰(zhàn),但市場競爭與投資熱情尚未減退,競爭者們在持續(xù)下注。比如,馬斯克旗下的大模型獨角獸xAI和X平臺及英偉達合作,已建成了10萬片H100 GPU的強大集群;Meta投入了400億打造類似規(guī)模的GPU集群,以支持Llama 4模型的訓(xùn)練;蘋果也在積極推進與富士康的合作,提升自家設(shè)備的AI算力。
來源:The Information
(本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【智東西】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。)