“揭開文心一言飛速升級(jí)背后的秘密。”
“兩個(gè)多月,四次迭代,核心場(chǎng)景推理性能提高50倍。”
這是百度在過去70天間為文心一言交出的成績(jī)單。僅僅在兩周前的技術(shù)交流會(huì)上,文心一言性能提升還不過十倍。
也是在那次交流會(huì)上,百度首次現(xiàn)場(chǎng)演示了大模型微調(diào)過程,文心一言背后的絕對(duì)功臣“文心千帆”才開始悄然走進(jìn)公眾視野。
此前,公眾對(duì)于百度更為熟知的一直是“文心一言”這一對(duì)話式AI產(chǎn)品,鮮少有人看到為其提供支撐的文心千帆大模型平臺(tái)。
而現(xiàn)在,它終于適時(shí)地開始浮出水面,這對(duì)于熱衷擁抱大模型的企業(yè)而言,無疑是一個(gè)好消息。
文心一言幕后的支撐者
文心一言的迭代速度令人驚嘆,在5月23日的技術(shù)交流會(huì)上,百度智能云副總裁朱勇表示,自內(nèi)測(cè)以來,通過算法和模型的持續(xù)優(yōu)化,文心一言的推理性能已經(jīng)大幅提升50倍。
僅僅在兩個(gè)多星期以前,文心一言的推理性能還停留在提升10倍的水平。在剛剛過去的二十天,基于文心千帆大模型平臺(tái),百度通過四層架構(gòu)(芯片-框架-模型-應(yīng)用)的端到端優(yōu)化,文心一言將高頻場(chǎng)景下的推理性能進(jìn)一步提升了5倍。此前,文心一言的推理成本已經(jīng)降到最初的十分之一,性能的提升也意味著相關(guān)成本進(jìn)一步的下降。
不少人可能還在好奇,文心千帆和文心一言有什么區(qū)別,是什么關(guān)系。如果用最通俗的話,文心一言更像一個(gè)To C產(chǎn)品,為用戶提供大模型對(duì)話的能力,而文心千帆則是開發(fā)、訓(xùn)練到應(yīng)用大模型的平臺(tái)。
更具體的講,文心千帆提供的服務(wù)能夠覆蓋人工智能研發(fā)的全生命周期,包括:數(shù)據(jù)管理、模型訓(xùn)練、模型評(píng)估、預(yù)測(cè)部署和插件服務(wù)等,能夠端到端地幫助客戶開發(fā)和部署大模型應(yīng)用。
在5月9日的技術(shù)交流會(huì)上,百度智能云就曾對(duì)外展示“文心千帆大模型平臺(tái)”,表示其是全球首個(gè)一站式的企業(yè)級(jí)大模型平臺(tái)。
5月23日的交流會(huì)中,百度智能云AI與大數(shù)據(jù)平臺(tái)總經(jīng)理忻舟對(duì)這一定義做了進(jìn)一步闡述。前述概念中有兩組關(guān)鍵字:其一是“一站式”,這意味著,文心千帆將提供從模型開發(fā)、應(yīng)用、推理,到數(shù)據(jù)回流、開發(fā)的全閉環(huán)過程,涵蓋大模型整個(gè)開發(fā)生命周期;其二是“企業(yè)級(jí)”,也就是文心千帆將提供眾多企業(yè)相關(guān)服務(wù),比如智能管控、數(shù)據(jù)安全、賬號(hào)管理等等。不僅支持文心一言的大模型服務(wù),也支持第三方的大模型。
過去一段時(shí)間,文心一言的迭代速度已經(jīng)側(cè)面證明了文心千帆在訓(xùn)練大模型方面的能力。我們看到百度成為國(guó)內(nèi)第一個(gè)發(fā)布大語言模型的企業(yè),也欣喜看到過去幾十天間文心一言火箭般的升級(jí)速度。
基于這樣的變化,我們可以預(yù)見,未來的一段時(shí)間,在文心千帆的加持下,文心一言的升級(jí)速度或許會(huì)更加超出我們的想象。
與此同時(shí),文心一言快速的迭代充分證明了文心千帆平臺(tái)的能力,讓更多想用大模型能力的企業(yè)堅(jiān)定擁抱。
從企業(yè)側(cè)來看,文心千帆近期舉辦的四場(chǎng)技術(shù)交流會(huì),場(chǎng)場(chǎng)爆滿,參會(huì)的幾乎都是企業(yè)客戶。據(jù)悉,截至目前,已經(jīng)有15萬家企業(yè)申請(qǐng)文心千帆的內(nèi)測(cè)。300余生態(tài)伙伴與百度簽約,展開在400多種場(chǎng)景內(nèi)的探索。
值得注意的是,文心千帆不僅支持文心一言的大模型服務(wù),也支持第三方的大模型。換句話說,客戶使用第三方大模型也可以在文心千帆上進(jìn)行部署和訓(xùn)練。
從企業(yè)需求側(cè)來看,當(dāng)今企業(yè)擁抱大模型,最關(guān)注的三個(gè)焦點(diǎn)是模型效果、成本和安全。即大模型與能給自身企業(yè)帶來多大的業(yè)務(wù)提升,以及自己是否用得起,以及數(shù)據(jù)是否能保證安全。
先來看效果,文心一言的訓(xùn)練成果已然從側(cè)面反映出,文心千帆作為大模型平臺(tái)的能力。此前,5月9日的現(xiàn)場(chǎng)演示顯示,僅十分鐘左右的微調(diào)以后,模型效果就得到了明顯提升。據(jù)了解,這樣的微調(diào)過程每次大約僅需標(biāo)注100條數(shù)據(jù),且模型能夠在類似的問題中產(chǎn)生一定的泛化能力。據(jù)百度智能云介紹,文心千帆開發(fā)效果的提升主要依托于AI大底座的能力,AI大底座的千卡并行線性加速比可以達(dá)到90%以上,訓(xùn)練資源利用率超過70%,模型開發(fā)迭代效率提升100%。而來自客戶的反饋也在證明這一點(diǎn),AI大底座提供的端到端優(yōu)化能力大大提高了模型迭代速度,這打動(dòng)了成立35年的金山辦公,雙方很快一拍即合,并且已經(jīng)開始逐漸在具體產(chǎn)品上落實(shí)。
就成本側(cè)而言,百度杰出系統(tǒng)架構(gòu)師王雁鵬表示,企業(yè)主要關(guān)注點(diǎn)集中于開發(fā)成本,即算力。但實(shí)際上,它占總成本的比例可能并不高,且這一成本可以通過很多方法降低,比如四層架構(gòu)端到端的優(yōu)化。算法、框架、系統(tǒng)和芯片,是一體化的。百度智能云副總裁朱勇表示,除了算力等整個(gè)底層資源的消耗,整個(gè)智能應(yīng)用的開發(fā),需要大量人力成本,大模型的出現(xiàn)使得這些工作門檻足夠低,這些工作交給文心千帆都將是個(gè)不錯(cuò)的選擇。
在安全層面,忻舟坦言,公有云需要非常高的安全機(jī)制,有完善的指令監(jiān)控、日志監(jiān)控、審核以及資源隔離機(jī)制,可以保證數(shù)據(jù)安全。從而在一定程度上保證用戶私域的數(shù)據(jù)安全。此外,客戶還可以選擇私有化部署的方式。
同時(shí),為了保護(hù)用戶的數(shù)據(jù)隱私,百度不會(huì)拿用戶數(shù)據(jù)做模型訓(xùn)練和迭代優(yōu)化。并且在符合政策要求情況下,這些數(shù)據(jù)會(huì)被刪除。
會(huì)后的交流中,忻舟進(jìn)一步解釋道:“我們要把這個(gè)功能每一個(gè)角度都做的足夠好,不用做的太復(fù)雜,其實(shí)更多的是靈活性更強(qiáng)一些,讓我們的客戶和用戶基于足夠的靈活性,能夠根據(jù)自己的業(yè)務(wù)需求開發(fā)自己所需要的場(chǎng)景的應(yīng)用,這是從產(chǎn)品角度來講需要精心設(shè)計(jì)的。”
從大模型到千行萬業(yè)
大模型的落地場(chǎng)景遠(yuǎn)不止文心一言。在更具體的行業(yè)層面,大模型的應(yīng)用場(chǎng)景擁有更大的想象空間。
剛剛過去的一季度,百度智能云首次實(shí)現(xiàn)盈利。百度智能云副總裁朱勇告訴雷峰網(wǎng),百度云能夠盈利,一方面在于不斷提升的產(chǎn)品標(biāo)準(zhǔn)化程度,是產(chǎn)品驅(qū)動(dòng);另一方面,基于芯片、框架、模型、應(yīng)用的四層架構(gòu)以及端到端優(yōu)化,都使得其成本不斷降低。
當(dāng)然,朱勇也表示,“大模型出現(xiàn)之后,我們也看到業(yè)界、客戶、合作伙伴的熱情,當(dāng)前都在積極聯(lián)合測(cè)試開發(fā),這對(duì)于我們接下來很多的項(xiàng)目,或者說很多產(chǎn)品落地、產(chǎn)品的發(fā)布節(jié)奏是非常有幫助的,未來可能會(huì)產(chǎn)生更多的收入來源?!?/p>
百度智能云六大智能產(chǎn)品正基于文心一言升級(jí),經(jīng)安全評(píng)估完成后將會(huì)上線。包括金融、政務(wù)、客服、寫作等行業(yè)和領(lǐng)域。
以智能創(chuàng)作為例,平臺(tái)將全方位賦能內(nèi)容生產(chǎn)者高效創(chuàng)作,高品質(zhì)內(nèi)容一步到位。從選題策劃、文本創(chuàng)作到圖片、視頻制作,涵蓋各個(gè)層面。
在選題上,智能創(chuàng)作平臺(tái)將提供新聞線索、熱點(diǎn)發(fā)現(xiàn)、事件脈絡(luò)梳理等一系列功能;基于大模型的輔助創(chuàng)作將升級(jí)為AI自動(dòng)創(chuàng)作,單篇?jiǎng)?chuàng)作時(shí)間從小時(shí)級(jí)縮減到分鐘級(jí),實(shí)現(xiàn)文章全流程自動(dòng)化寫作且支持交互式內(nèi)容修訂;提供16類場(chǎng)景化圖片,且提供圖片編輯、圖生圖等功能;實(shí)現(xiàn)圖文到視頻一站式生成和處理。
據(jù)百度智能云AI應(yīng)用產(chǎn)品部總經(jīng)理劉倩介紹,智能客服的應(yīng)答輔助、會(huì)話小結(jié)、智能工單、客服知識(shí)庫等功能在基于大模型完成升級(jí)后,知識(shí)生產(chǎn)效率提升9倍,多輪對(duì)話構(gòu)建成本下降65%,可讓終端用戶獲得到更聰明更擬人的的體驗(yàn)。
再如,在政務(wù)行業(yè),百度基于大模型打造了一網(wǎng)辦|政務(wù)服務(wù)助手、一問通|社區(qū)咨詢服務(wù)助手、一問通|社區(qū)咨詢服務(wù)助手、一網(wǎng)管|城運(yùn)洞察助手、一屏觀|智能分析助手等一系列產(chǎn)品,助力政府機(jī)構(gòu)實(shí)現(xiàn)數(shù)字智能和政務(wù)體驗(yàn)的雙增長(zhǎng)。
可以看到,大模型已經(jīng)不再是遙不可及的前沿技術(shù),基于它的應(yīng)用場(chǎng)景正逐漸深入到企業(yè)的生產(chǎn)鏈路中以及人們的日常生活。
除一系列智能應(yīng)用外,預(yù)計(jì)未來將會(huì)有越來越多的產(chǎn)品基于大模型升級(jí),最先從中獲益的是百度網(wǎng)盤等七大企業(yè)級(jí)產(chǎn)品。據(jù)悉,基于大模型的百度網(wǎng)盤企業(yè)版,將為企業(yè)提供數(shù)字智能管理平臺(tái)。升級(jí)后的百度網(wǎng)盤能夠通過對(duì)話式交互,幫助企業(yè)版用戶對(duì)文件內(nèi)容進(jìn)行總結(jié)、翻譯、問答等加工處理。據(jù)百度智能云副總裁朱勇透露,百度將在所有業(yè)務(wù)中都集成文心一言的能力,內(nèi)部做了非常詳細(xì)的規(guī)劃。
企業(yè)何去何從
此前,在《從智能云首次盈利,看百度如何在大模型時(shí)代奔流》一文中,雷峰網(wǎng)就曾提及,隨著大模型到來,百度智能云的客戶超出預(yù)期,不少過去不太愿意用的機(jī)構(gòu)開始主動(dòng)與百度溝通。換句話說,越來越多的企業(yè)正選擇擁抱大模型。
在5月9日的發(fā)布會(huì)上,百度工程師首次現(xiàn)場(chǎng)通過“文心千帆”演示了大模型微調(diào)的過程。當(dāng)時(shí),忻舟還表示,“快且收斂,是大模型應(yīng)用訓(xùn)練中一個(gè)非常重要的指標(biāo)。只快不收斂,大模型的訓(xùn)練是沒有用的。文心千帆在多機(jī)多卡訓(xùn)練性能方面,可以更快達(dá)到收斂的狀態(tài),在全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf榜單中排名世界第一?!痹谛弥劭磥恚髽I(yè)想用好大模型,只有大模型仍不夠,還需要有成熟完備的大模型生產(chǎn)平臺(tái)。
事實(shí)上,也確實(shí)如此,客戶的積極溝通和擁抱說明了一切。除卻上文提到的金山辦公外,金蝶、軟通動(dòng)力等不少企業(yè)都已經(jīng)或正在與文心千帆溝通簽約事宜。
5月18日,在百度智能云合作伙伴大會(huì)上,金蝶與文心千帆現(xiàn)場(chǎng)簽約,正式成為文心千帆的合作伙伴。金蝶中國(guó)助理總裁韓革纓在演講中表示,目前金蝶已經(jīng)接入了百度文心一言大模型,不斷在各種探索驗(yàn)證并產(chǎn)生了不錯(cuò)的成果。未來,金蝶還會(huì)結(jié)合百度文心一言等大模型,利用金蝶的行業(yè)知識(shí)、專有數(shù)據(jù),在特定任務(wù)上進(jìn)行行業(yè)模型的打造,不斷去升級(jí)金蝶原有的NLP、OCR等應(yīng)用,探索更多的業(yè)務(wù)場(chǎng)景。
朱勇坦言,文心千帆大模型平臺(tái),將為企業(yè)提供開發(fā)應(yīng)用大模型的最好的環(huán)境,是客戶擁抱AI的最佳路徑。我們希望文心千帆大模型平臺(tái),能夠讓我們的客戶和合作伙伴用最簡(jiǎn)單的方式,用上大模型,用好大模型。
如前所述,文心千帆不僅提供包括文心一言在內(nèi)的大模型服務(wù),也為客戶提供了完整的工具鏈和開發(fā)訓(xùn)練環(huán)境,能充分滿足客戶需求。
未來,文心千帆主要將提供兩種服務(wù):
第一,以文心一言為核心,提供大模型服務(wù),幫助客戶改造產(chǎn)品和生產(chǎn)流程。朱勇表示,這有點(diǎn)“淘金”的意味,真正的挖掘金子,通過提供模型服務(wù)的方式賦能客戶。
第二,作為大模型生產(chǎn)平臺(tái),企業(yè)可以在文心千帆上基于任何開源或閉源的大模型,開發(fā)自己的專屬大模型。朱勇對(duì)此解釋道,“從百度來說,作為業(yè)界頭部的AI公司,百度還是希望能夠更加全面,給客戶提供各種各樣的服務(wù),只要跟大模型相關(guān)的,都是我們的‘菜’。”
此外,針對(duì)不同客戶需求,文心千帆也將會(huì)針對(duì)性提供多樣性的服務(wù)模式:公有云層面,文心千帆提供推理、微調(diào)、托管等服務(wù);私有化部署方面,文心千帆則通過軟件授權(quán)、軟硬一體、租賃服務(wù)的方式交付給客戶。
盡管文心千帆為客戶提供了大模型從開發(fā)、訓(xùn)練、微調(diào)、數(shù)據(jù)回流等全閉環(huán)過程,涵蓋整個(gè)生命周期,但并不是所有的企業(yè)都適于從頭開發(fā)訓(xùn)練基礎(chǔ)模型。
朱勇坦言,其實(shí)訓(xùn)練一個(gè)基礎(chǔ)模型成本是非常高的,如果真的要做一個(gè)千億級(jí)的大模型,需要單機(jī)群萬卡以上的算力,不僅要有GPU卡,還要有能夠把GPU的集群資源利用起來,這個(gè)往往不是很多的公司能做的。
在他看來,未來,基礎(chǔ)模型(大的底層模型)可能就那么幾家,但是基于此,會(huì)有很多不同專業(yè)和行業(yè)類型的大模型,這些不同領(lǐng)域的模型將來支撐上層非常繁榮的領(lǐng)域應(yīng)用。
據(jù)忻舟介紹,從行業(yè)來看,目前大模型普及較多的領(lǐng)域以信息化和技術(shù)普及率較高行業(yè)為主,比如,金融、能源以及泛互聯(lián)網(wǎng)行業(yè)等。
后記:生成式AI未來可期
近兩月來,大模型遍地開花。企業(yè)關(guān)注的焦點(diǎn),已經(jīng)從大模型的產(chǎn)品功能,轉(zhuǎn)向如何以更快的速度用好大模型,完成產(chǎn)業(yè)鏈的創(chuàng)新再造,實(shí)現(xiàn)彎道超車。
百度智能云方面透露,目前已有15萬企業(yè)申請(qǐng)文心一言內(nèi)測(cè),其中有超300家生態(tài)伙伴在400多個(gè)具體場(chǎng)景取得測(cè)試成效,包括辦公提效、知識(shí)管理、智能客服、智能營(yíng)銷等代表性場(chǎng)景。
作為國(guó)內(nèi)最早發(fā)布大模型產(chǎn)品的企業(yè),百度在大模型領(lǐng)域的探索一直在路上:從文心一言的發(fā)布,到一系列應(yīng)用場(chǎng)景的展示,再到如今文心千帆步入內(nèi)測(cè)階段,為企業(yè)提供開發(fā)AI應(yīng)用的各種工具鏈及整套環(huán)境,試圖覆蓋人工智能研發(fā)的全生命周期。
正如文心千帆負(fù)責(zé)人忻舟的話:“生成式AI是百年難見的技術(shù)變革,我們雖然在起步中,技術(shù)還在發(fā)展中,但我相信它的未來一定會(huì)為我們帶來很多自己應(yīng)用的創(chuàng)新和效率的提升。我們擁有最多的人、企業(yè)、場(chǎng)景,百度努力在生成式AI大模型路上。