編譯?|??程茜
編輯?|??云鵬
生成式AI競賽升溫,Meta考慮放寬開源AI大模型訪問范圍。
智東西6月16日消息,今天凌晨,據(jù)外媒The Information報道,Meta CEO馬克·扎克伯格(Mark Zuckerberg)正在考慮將開源大型語言模型LLaMA的新版本商業(yè)化,讓其它公司免費使用LLaMA開發(fā)相關(guān)AI軟件,并允許開發(fā)者將這些產(chǎn)品用于商業(yè)用途。最初,Meta僅將開源大型語言模型LLaMA授權(quán)給學(xué)術(shù)界的研發(fā)人員使用,此次將其開源模型用于商業(yè)用途或許會顛覆谷歌、OpenAI、微軟等公司的商業(yè)模式,因為它們一直是以付費形式讓開發(fā)者獲得其大型語言模型的訪問權(quán)。
知情人士透露,此舉可能會引發(fā)AI相關(guān)開發(fā)人員的狂熱支持,因為這些開發(fā)者希望獲得谷歌、OpenAI出售的相關(guān)付費軟件的替代品。同時,這也有助于Meta改進自己的AI模型。
但Meta的開源大型語言模型用于商業(yè)用途的計劃現(xiàn)在已經(jīng)面臨諸多挑戰(zhàn),此前也有相關(guān)信息爆出,OpenAI正準(zhǔn)備向公眾發(fā)布一種新的開源大型語言模型,并且大型語言模型商業(yè)化意味著Meta用于訓(xùn)練的數(shù)據(jù)將受到更加嚴(yán)格的法律監(jiān)管,一旦被發(fā)現(xiàn)其數(shù)據(jù)中包含受版權(quán)保護的部分,Meta將承擔(dān)相應(yīng)的法律責(zé)任。
01.此前僅做研究用途LLaMA廣泛應(yīng)用受限
今年2月,Meta發(fā)布了開源大型語言模型第一個版本LLaMA,可以幫助學(xué)術(shù)界的研究人員開發(fā)ChatGPT的替代品。
▲LLaMA相關(guān)研究論文
Meta的大型語言模型雖然只被授權(quán)用于研究,但仍然在業(yè)內(nèi)產(chǎn)生了不小的影響。研究人員使用LLaMA來開發(fā)開源模型,例如130億參數(shù)規(guī)模的開源模型Vicuna,其性能在某些指標(biāo)上已接近OpenAI、谷歌的大型語言模型。
同時,這一開源大型語言模型在研究領(lǐng)域的應(yīng)用也能幫助Meta改進自己的產(chǎn)品和模型。今年4月,扎克伯格在與股票分析師的電話會議上稱,開發(fā)人員開始采用、改進這些模型或者修補安全漏洞,與此同時,Meta也可以將他們對模型的優(yōu)化集成到自己的大型語言模型中,同時使自己的消費者或者廣告產(chǎn)品的體驗更好。
扎克伯格此前曾提到,他希望使用社交平臺Facebook的小型企業(yè)和內(nèi)容創(chuàng)作者都能擁有“AI agents(AI代理)”,這些代理可以幫助企業(yè)和內(nèi)容創(chuàng)作者自動與客戶或者粉絲溝通,代替他們完成工作。他在上周接受采訪時說:“LLaMA或它背后的大型語言模型基本上將成為推動它的引擎。”
此前,Meta選擇將LLaMA用于研究,所以目前其大型語言模型并不能用于商業(yè)目的,這也進一步限制了LLaMA的更廣泛應(yīng)用,同時決定了它被應(yīng)用于商業(yè)應(yīng)用程序的難度更大。
而特殊情況下,LLaMA也能用于商業(yè)用途,但會存在很多限制,比如應(yīng)用程序訪問的專用服務(wù)器供應(yīng)量并不充足,并且這類服務(wù)器的成本會更高。
02.開源模型或面臨法律風(fēng)險OpenAI也要將開源提上日程?
現(xiàn)在已經(jīng)有一些開源大型語言模型發(fā)布,或者有相應(yīng)公司已經(jīng)將大型語言模型提上日程,因此Meta在開源AI的競賽中可能面臨諸多競爭。
6月初,阿聯(lián)酋阿布扎比科技創(chuàng)新研究所開發(fā)了開源大型語言模型Falcon,該模型已經(jīng)受到眾多開發(fā)者青睞。
5月初,The Information曾報道過,有知情人士透露,OpenAI正準(zhǔn)備向公眾發(fā)布一種新的開源大型語言模型。這一計劃如果能被推進下去,OpenAI可能會進一步對AI行業(yè)產(chǎn)生重大影響。
還有一位直接知情的人士透露,OpenAI已經(jīng)內(nèi)部討論過將大型語言模型用于商業(yè)用途。但值得注意的是,這一大型語言模型的性能可能與其最先進的GPT-4有一定差距。
除其它大型語言模型的競爭外,Meta將其下一個版本的大型語言模型商業(yè)化時,如果一旦被發(fā)現(xiàn)其使用受版權(quán)保護的數(shù)據(jù)進行訓(xùn)練,可能使該公司承擔(dān)潛在的法律責(zé)任。
上個月,Meta的首席AI科學(xué)家Yann LeCun在接受采訪時也提到了為什么Meta迄今尚未許可LLaMA用于商業(yè)用途,他談到兩個原因,首先他并不是唯一參與此類決定的人,其次這一決定的執(zhí)行可能存在法律責(zé)任問題。
不過,據(jù)一位直接了解情況的Meta前員工稱,Meta在發(fā)布LLaMA第一個版本的時候就解決了法律問題,當(dāng)時Meta的法律、產(chǎn)品、隱私部門的員工就如何將其授權(quán)給開發(fā)者進行了廣泛的討論。
Meta和OpenAI的發(fā)言人都拒絕就上述信息置評。
03.結(jié)語:開源讓生成式AI競賽繼續(xù)升溫
此前,Meta將LLaMA模型開源開放,就在業(yè)界引起了廣泛討論。其中,谷歌高級工程師盧克?塞爾瑙(Luke Sernau)關(guān)于開源大型語言模型的一份內(nèi)部備忘錄引起了眾多開發(fā)者共鳴,他提到,“如果有免費、高質(zhì)量的替代品,誰還會為有使用限制的谷歌產(chǎn)品付費?”。
盡管他可能夸大了開源大型語言模型的影響力以及開源帶來的挑戰(zhàn),但他的一個觀點得到了眾多從業(yè)者的認(rèn)可,那就是Meta將從發(fā)布其開源模型中獲益。
據(jù)了解,LLaMA發(fā)布幾周后學(xué)術(shù)界就通過這一模型開發(fā)了開源軟件,打造了ChatGPT等軟件的免費替代產(chǎn)品?,F(xiàn)在,Meta要將新版本的大型語言模型用于商業(yè)用途,又有相關(guān)爆料顯示,OpenAI也將加入開源大型語言模型的競賽中,下一步圍繞開源可能會成為AI產(chǎn)業(yè)玩家們的又一大競爭點。