作者 |??程茜,編輯?|??心緣
“草莓”模型對(duì)OpenAI新旗艦?zāi)P图癎PT-4的改進(jìn)都至關(guān)重要。
OpenAI的“草莓”要熟了?
智東西8月28日?qǐng)?bào)道,今天,外媒The Information援引知情人士稱,OpenAI將在今年秋天推出代號(hào)為“草莓”(之前被稱為Q*)的新模型。
“草莓”項(xiàng)目就是盛傳已久的神秘Q*模型,據(jù)傳是此前戲劇化的OpenAI政變關(guān)鍵原因之一。它展現(xiàn)出了解答未見(jiàn)過(guò)的數(shù)學(xué)問(wèn)題、復(fù)雜編程的更強(qiáng)大能力,當(dāng)時(shí)讓AI安全的研究人員都為之震驚。
這一項(xiàng)目當(dāng)下最重要的用處有兩個(gè):一是改進(jìn)ChatGPT等現(xiàn)有產(chǎn)品,二是幫助OpenAI開發(fā)下一代旗艦?zāi)P蚈rion。這些都指向了OpenAI想要保持自己在大模型領(lǐng)導(dǎo)地位,并獲得更多收入機(jī)會(huì)的決心。不過(guò),近日OpenAI還被曝出已經(jīng)向美國(guó)國(guó)家安全官員展示了“草莓”項(xiàng)目,這可能是這家創(chuàng)企安全部門高管頻繁離職背景下,想要讓產(chǎn)品提高透明度的舉措。本月初,OpenAI CEO Sam Altman在推特暗戳戳秀自家花園5顆草莓的時(shí)候,就有網(wǎng)友根據(jù)草莓成熟時(shí)間跳了預(yù)言家:GPT-5可能在未來(lái)4-6周內(nèi)確認(rèn)發(fā)布。這正好和現(xiàn)在秋天可能發(fā)布的時(shí)間點(diǎn)對(duì)上了。
可能在不久的將來(lái),我們就能看到“草莓”項(xiàng)目被直接集成到了ChatGPT里。
01.穩(wěn)住大模型霸主地位“草莓”能幫新旗艦?zāi)P蜏p少幻覺(jué)
“草莓”項(xiàng)目是OpenAI新取得的重要技術(shù)里程碑,能解決以前從未見(jiàn)過(guò)的數(shù)學(xué)問(wèn)題,經(jīng)過(guò)訓(xùn)練可以解決涉及編程的問(wèn)題,回答產(chǎn)品營(yíng)銷策略等主觀問(wèn)題、解決復(fù)雜字謎游戲都可以。
一直沒(méi)有浮出水面的“草莓”模型,近段時(shí)間沖到大眾視野的跡象變得更加明顯。
除了Altman秀5顆草莓,還有OpenAI研究員Trevor Creech發(fā)文在OpenAI吃晚餐,盤子里是草莓。
新模型腳步可能越來(lái)越近的現(xiàn)實(shí)情況下,這可能是OpenAI想要保持自己在大模型領(lǐng)域霸主地位的舉措,畢竟它的競(jìng)爭(zhēng)對(duì)手已經(jīng)拿出了不少與OpenAI最新旗艦?zāi)P虶PT-4性能相當(dāng)?shù)哪P汀?/p>
盡管目前OpenAI的模型仍是企業(yè)和AI應(yīng)用程序開發(fā)者的首選,但來(lái)自谷歌、xAI、Anthropic和Meta等其他企業(yè)的模型正在諸多排行榜上迅速趕上OpenAI。
因此,OpenAI的前景在一定程度上取決于它最終能否推出一款代號(hào)為Orion的新旗艦?zāi)P?。該模型旨在改進(jìn)其去年年初推出的旗艦?zāi)P虶PT-4,后者于去年年初推出。
而“草莓”項(xiàng)目的發(fā)布就對(duì)Orion的訓(xùn)練至關(guān)重要——它可以為Orion生成高質(zhì)量訓(xùn)練數(shù)據(jù),減少幻覺(jué)。
“草莓”模型可以幫助OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制,從而利用從互聯(lián)網(wǎng)上提取的文本或圖像等現(xiàn)實(shí)世界數(shù)據(jù)來(lái)訓(xùn)練新模型。
智能體創(chuàng)企Minion AI首席執(zhí)行官、GitHub Copilot前首席架構(gòu)師Alex Graveley認(rèn)為,使用“草莓”模型生成更高質(zhì)量的訓(xùn)練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯(cuò)誤數(shù)量,即所謂的幻覺(jué)。該模型之所以能夠做到這一點(diǎn),是因?yàn)椤坝?xùn)練數(shù)據(jù)中的歧義較少,所以它猜測(cè)的次數(shù)較少”。
除了下一代旗艦?zāi)P停安葺表?xiàng)目的推出也能改進(jìn)OpenAI的現(xiàn)有產(chǎn)品。OpenAI內(nèi)部正在通過(guò)“提煉”過(guò)程來(lái)簡(jiǎn)化和縮小“草莓”模型,以便在Orion發(fā)布之前將其用于提升現(xiàn)有產(chǎn)品的性能。這種“草莓”模型的較小、簡(jiǎn)化版本,能夠在保持與較大模型相同性能水平的同時(shí),更易于操作且成本更低。
一個(gè)顯而易見(jiàn)的想法是將“草莓”模型改進(jìn)的推理能力融入ChatGPT中。這可能意味著用戶雖然獲得了更準(zhǔn)確的答案,但速度會(huì)變慢。
因此,這可能不適用于SearchGPT搜索引擎等用戶希望能獲得立即響應(yīng)的工具,但非常適合對(duì)時(shí)間不太敏感的用例,例如修復(fù)GitHub中的非關(guān)鍵編碼錯(cuò)誤。
那是不是在不久的將來(lái),ChatGPT用戶能夠根據(jù)請(qǐng)求的時(shí)間敏感度來(lái)自主選擇打開或關(guān)閉“草莓”模型。
02.OpenAI收入告急?今年夏天已向政府官員展示
面對(duì)資金實(shí)力雄厚的科技大公司以及瘋狂吸金的創(chuàng)企勁敵,OpenAI需要開辟更多的收入機(jī)會(huì)。
盡管相比于一年前OpenAI業(yè)務(wù)增長(zhǎng)飛速,目前其向企業(yè)銷售的API和ChatGPT訂閱收入增長(zhǎng)了約兩倍,達(dá)到每月2.83億美元,但OpenAI每月的虧損可能更高。The Information基于此前未披露的內(nèi)部財(cái)務(wù)數(shù)據(jù)和參與該業(yè)務(wù)的人士的分析,OpenAI今年可能虧損高達(dá)50億美元。
知情人士透露,Altman希望為公司籌集更多資金,并尋找減少損失的方法。作為與微軟達(dá)成商業(yè)合作的一部分,OpenAI自2019年以來(lái)已從微軟籌集了約130億美元,該合作將持續(xù)到2030年。但合作條款可能會(huì)發(fā)生變化,包括OpenAI如何向微軟支付租用云服務(wù)器的費(fèi)用以開發(fā)其模型,這也是目前是OpenAI最大的成本支出。
鑒于現(xiàn)有的ChatGPT等對(duì)話式AI在航空航天和結(jié)構(gòu)工程等數(shù)學(xué)密集型領(lǐng)域并不擅長(zhǎng),解決棘手?jǐn)?shù)學(xué)問(wèn)題的模型可能是一個(gè)潛在的有利可圖的應(yīng)用。同時(shí),數(shù)學(xué)推理的改進(jìn)也可以幫助模型更好地推理對(duì)話查詢,例如客戶服務(wù)請(qǐng)求。
谷歌和一些初創(chuàng)公司也在開發(fā)推理技術(shù)。上個(gè)月,谷歌DeepMind的模型在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中擊敗了大多數(shù)人類參賽者;Anthropic最新的模型可以編寫更復(fù)雜的代碼、回答有關(guān)圖表和圖形的能力;還有一些創(chuàng)企通過(guò)將問(wèn)題分解為更小的步驟來(lái)提高推理能力,但這種方法速度慢且成本更高……
因此,“草莓”模型的發(fā)布可能會(huì)為推理技術(shù)帶來(lái)新的思路。
Altman今年5月就曾透露“我們覺(jué)得我們擁有足夠的數(shù)據(jù)來(lái)開發(fā)下一個(gè)模型。我們已經(jīng)進(jìn)行了各種實(shí)驗(yàn),包括生成合成數(shù)據(jù)?!彼?dāng)時(shí)可能指的就是Orion模型。
一位直接知情人士稱,OpenAI在今年夏天向國(guó)家安全官員展示了“草莓”模型的能力。
此次演示可能是OpenAI努力向美國(guó)政策制定者提高透明度的一部分,近幾個(gè)月來(lái),OpenAI聯(lián)合創(chuàng)始人之一John Schulman等幾位安全部門的高管離職,這也使得業(yè)界對(duì)于OpenAI的技術(shù)安全更加關(guān)注。
03.結(jié)語(yǔ):OpenAI尋求開辟更多收入機(jī)會(huì)
推出“草莓”模型是OpenAI是在大模型產(chǎn)業(yè)中永無(wú)止境的戰(zhàn)斗的一部分,它要領(lǐng)先于其他資金雄厚的競(jìng)爭(zhēng)對(duì)手,穩(wěn)固自己在大模型領(lǐng)域的霸主地位。此外,這項(xiàng)技術(shù)還對(duì)未來(lái)的產(chǎn)品產(chǎn)生影響,如解決多步驟任務(wù)的智能體等。
OpenAI等大模型玩家同樣希望借此能在這一領(lǐng)域開辟出更多的收入機(jī)會(huì),以支持高昂的大模型訓(xùn)練費(fèi)用。