隨著時(shí)間來(lái)到2023年第三季度,國(guó)產(chǎn)大模型已經(jīng)達(dá)到100多個(gè),“百模大戰(zhàn)”正式開啟。
大模型,我們有了很多選擇,也開始呈現(xiàn)出某種同質(zhì)化。除了拼參數(shù)、比背景、看榜單,有沒有其他方法,讓我們更好地判斷一個(gè)大模型的價(jià)值呢?
亞里士多德認(rèn)為,任何一個(gè)系統(tǒng)都有自己的第一性原理,它是一個(gè)根基性命題或假設(shè),不能缺省,也不能被違背。
透過表象,追尋本質(zhì),會(huì)發(fā)現(xiàn)各家大模型的 “第一性原理”,有很大的不同。而這個(gè)核心的不同,也會(huì)帶動(dòng)大模型走向不同的發(fā)展模式。
比如OpenAI的內(nèi)核是AGI,大語(yǔ)言模型以“通用人工智能”的目標(biāo),作為出發(fā)點(diǎn),最近才開始走向行業(yè)。
一些通用大模型,內(nèi)核是“科研”,在榜單上有不俗的成績(jī),而行業(yè)應(yīng)用所需要的配套工具、算力基礎(chǔ)設(shè)施等,則不在研發(fā)者的考量中,逐漸淡出主流視野。
一些產(chǎn)業(yè)大模型,內(nèi)核是“應(yīng)用”,要快速勝任某一些具體的任務(wù)場(chǎng)景,加入了行業(yè)知識(shí)和專有數(shù)據(jù)“特訓(xùn)”,可基礎(chǔ)模型能力一般,遇到“常識(shí)性問題”就掉鏈子。
工具可以開發(fā),算力可以買,一個(gè)大模型的內(nèi)在價(jià)值核心,卻不會(huì)輕易替換。
我們一層層剝開京東大模型,看到了一個(gè)核心,就是——“產(chǎn)業(yè)”。
最近恰逢WAIC和JDD大會(huì),我們跟京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬博士,進(jìn)行了多次交流,他深入分享了很多京東對(duì)于大模型的思考。
將“產(chǎn)業(yè)價(jià)值”作為大模型的“第一性原理”,會(huì)讓大模型走出怎樣一條差異化的發(fā)展之路呢?我們不妨以京東為例,來(lái)展望一下產(chǎn)業(yè)大模型的未來(lái)。
大模型的價(jià)值起點(diǎn)
巴菲特曾說過,投資是滾雪球,找到“長(zhǎng)長(zhǎng)的坡”和“很濕的雪”,雪球一旦啟動(dòng),堅(jiān)持下去,就能越滾越大。
從產(chǎn)業(yè)的視角出發(fā),會(huì)發(fā)現(xiàn)大模型這顆“雪球”的核心價(jià)值自證,確實(shí)還存在著很多問題,比如:
1.技術(shù)的可用性存疑。
產(chǎn)業(yè)化最后一公里的問題,看起來(lái)好像不大,卻是決定大模型能用不能用的邊界。
京東從2017年開始關(guān)注大模型,就很注重行業(yè)落地,也碰到了一些經(jīng)驗(yàn)教訓(xùn)。
何博士直言,“拿著刷榜的技術(shù)給業(yè)務(wù)部門去秀,用起來(lái)碰到各種各樣的小問題,對(duì)使用者來(lái)說不可用,后來(lái)人家就不信你了,你再怎么說也覺得你技術(shù)不行”。
2.行業(yè)的連接不夠充沛。
大模型落地,需要解決一個(gè)一個(gè)具體問題。這些問題不可能在實(shí)驗(yàn)室里“涌現(xiàn)”,行業(yè)到底需求什么,有哪些限制條件,都要從產(chǎn)業(yè)實(shí)踐和應(yīng)用中找到答案。
何曉冬博士認(rèn)為,大模型是不能自己坐在辦公室拍腦袋想出來(lái)的,一定是行業(yè)凝練出來(lái)的。
但向上觸碰學(xué)術(shù)、向下扎根行業(yè),這樣的AI研究機(jī)構(gòu)本身就很稀缺。
3.價(jià)值回報(bào)還很朦朧。
引入大模型,意味著企業(yè)要增加各種成本,消耗大量的資源。企業(yè)引入大模型,也希望得到經(jīng)過反復(fù)嘗試被證明沒有問題的產(chǎn)品。目前很多大模型的價(jià)值自證,還不夠有力。
何博士就提到,一般的生成式語(yǔ)言模型,內(nèi)容正確率是83%、85%左右,to C用戶覺得還可以,但嚴(yán)肅商用的時(shí)候,模型正確率要達(dá)到95%以上,才能達(dá)到企業(yè)的要求。“明明這個(gè)活動(dòng)打的是八折,大模型生成的營(yíng)銷文案說是五折,這個(gè)事情商業(yè)上是不可接受的”。
事非躬行不知難,大模型急需一場(chǎng)產(chǎn)業(yè)價(jià)值的自證與他證。
破解方式其實(shí)也很簡(jiǎn)單,就是一步一個(gè)腳印,把該踩的坑都踩了,把遇到的問題都一一解決。
所以年初,大語(yǔ)言模型高歌猛進(jìn)的時(shí)候,京東沒有跟風(fēng),它在忙什么?忙著解決問題。
京東的長(zhǎng)坡
以“產(chǎn)業(yè)價(jià)值”作為 “第一性原理”,京東做大模型最先關(guān)注的,不是簽了多少單,什么時(shí)候開發(fā)布會(huì),而是夯實(shí)基礎(chǔ)設(shè)施。
AI三要素:數(shù)據(jù)、算力、算法,都需要升級(jí),才能撐住大模型時(shí)代,如同一個(gè)“長(zhǎng)坡”,讓大模型的“價(jià)值雪球”可以向前滾動(dòng)。
先說數(shù)據(jù)。產(chǎn)業(yè)大模型,一般是先用公域數(shù)據(jù)訓(xùn)練基礎(chǔ)模型,再用行業(yè)專有數(shù)據(jù)進(jìn)行“特訓(xùn)”,相當(dāng)于先在中學(xué)上通識(shí)課,再到大學(xué)里去學(xué)專業(yè)技能。京東的思路很不一樣,言犀大模型訓(xùn)練時(shí)融合70%的通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),把零售、金融、健康、物流的know-how和數(shù)據(jù),也放到基座模型中,相當(dāng)于既做了通識(shí)教育,又上了很多門專業(yè)課,有更多的行業(yè)理解。
所以京東的大模型一推出來(lái),面向知識(shí)密集型、任務(wù)型產(chǎn)業(yè)場(chǎng)景,已經(jīng)可以解決真實(shí)產(chǎn)業(yè)問題。
再說算法。算法是大模型的核心能力,也是拉開產(chǎn)品體驗(yàn)差距的關(guān)鍵。目前,單點(diǎn)算法已經(jīng)不足以撐起大模型了,大語(yǔ)言模型就包含了強(qiáng)化學(xué)習(xí)、提示學(xué)習(xí)、預(yù)訓(xùn)練等一系列優(yōu)化。成體系的技術(shù)體系和算法創(chuàng)新,也更容易形成護(hù)城河。
然后是算力。很多大模型推出后不久便停止開放、限制互動(dòng)次數(shù),就是因?yàn)樗懔Σ蛔慊虺杀景嘿F,企業(yè)想用也用不起。所以,大模型后續(xù)能否持續(xù)為產(chǎn)業(yè)所用,算力不能成為短板。
京東在2021年就建立了最先進(jìn)的DGX集群,在重慶落地了全國(guó)首個(gè)基于SuperPOD架構(gòu)的超大規(guī)模計(jì)算集群——天琴α,推理提速6.2倍,推理成本節(jié)省90%,為基礎(chǔ)大模型的訓(xùn)練和迭代提供保障,保持競(jìng)爭(zhēng)力。
一路深耕AI三要素,京東為大模型從技術(shù)走向產(chǎn)業(yè),構(gòu)筑了一條“長(zhǎng)坡”。至此,大模型的價(jià)值底座,已經(jīng)非常堅(jiān)實(shí)。
產(chǎn)業(yè)的厚雪
回顧上一階段的產(chǎn)業(yè)智能化,很多技術(shù)能力都停留在表面,難以深入行業(yè)或規(guī)模化復(fù)制。大模型的價(jià)值變得飽滿,要卷起產(chǎn)業(yè)的“厚雪”,將雪球越滾越大。
在何曉冬博士分享的一系列京東大模型技術(shù)和實(shí)踐里,我們可以看到,大模型黏住產(chǎn)業(yè)“厚雪”的多種姿勢(shì):
一是技術(shù)黏著。
產(chǎn)業(yè)AI落地難的很多問題,其實(shí)都源于技術(shù)瓶頸,比如深度學(xué)習(xí)的不可解釋性、泛化能力不足、模型精度不夠等。京東通過基礎(chǔ)技術(shù)的體系化突破,讓大模型變得高可用,形成端到端的產(chǎn)品價(jià)值。
比如數(shù)字人,基于10余年智能對(duì)話經(jīng)驗(yàn)與多模態(tài)交互技術(shù)積淀,京東云多模態(tài)數(shù)字人只需要極少量樣本素材,5分鐘簡(jiǎn)易拍攝,就可以自動(dòng)生成聲情并茂的數(shù)字人,讓中小商家與個(gè)人能夠用得起、用得上數(shù)字人服務(wù),算力、開發(fā)周期、人才等高門檻不再成為問題。
二是工具黏著。
目前,很多大模型廠商都開放了API調(diào)用的MaaS服務(wù),但一個(gè)容易忽略的問題是,調(diào)API也是需要一定能力和開發(fā)工作的,很多傳統(tǒng)行業(yè)的用戶,連AI基礎(chǔ)調(diào)用API的能力都不一定有。
豐富、極簡(jiǎn)、開箱即用的工具,是產(chǎn)業(yè)落地必不可少的條件。京東的目標(biāo)是,讓對(duì)AI完全沒有認(rèn)知的用戶,也可以直接使用大模型,提供從數(shù)據(jù)模型到應(yīng)用服務(wù)的全周期管理,從基礎(chǔ)層、模型層、MaaS,延伸到了應(yīng)用層的SaaS服務(wù)。
言犀大模型開放計(jì)算平臺(tái)的行業(yè)知識(shí)庫(kù),就沉淀了100多種訓(xùn)練和推理優(yōu)化工具,不到一周時(shí)間,即可完成從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、到模型部署的全流程。
三是實(shí)踐黏著。
比起某個(gè)榜單上的書面效果,企業(yè)應(yīng)用大模型,更希望看到實(shí)際應(yīng)用中的真實(shí)效果,對(duì)技術(shù)能力和價(jià)值收益有一個(gè)更清晰的感知。京東已經(jīng)進(jìn)行了大量的產(chǎn)業(yè)實(shí)踐,優(yōu)勢(shì)格外明顯。
目前,大模型在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場(chǎng)景大規(guī)模錘煉,并融合行業(yè)解決方案對(duì)外輸出,可以減少大模型落地的顧慮和成本。
比如文本生成,零售領(lǐng)域的文案,每個(gè)品類的敏感信息審核門檻都不一樣,基于京東全品類豐富的商品數(shù)據(jù)積累和大模型,京東云AIGC內(nèi)容營(yíng)銷平臺(tái),已經(jīng)可以通過一張商品圖片,生成電商運(yùn)營(yíng)需要的商品主圖,營(yíng)銷海報(bào)圖和商詳圖等,每套圖成本降低90%,周期從7天縮短到半天,而且不用擔(dān)心內(nèi)容有風(fēng)險(xiǎn),因?yàn)榇竽P偷陌踩尚牛诰〇|零售內(nèi)部已經(jīng)錘煉過了。
再比如健康診療,是一個(gè)對(duì)內(nèi)容專業(yè)性和可靠性要求非常高的場(chǎng)景,京東健康應(yīng)用大模型,進(jìn)行健康助手及輔助診療,已涵蓋超千種疾病專業(yè)性服務(wù),目前累計(jì)超3千萬(wàn)高質(zhì)量醫(yī)患對(duì)話,百萬(wàn)級(jí)規(guī)模醫(yī)學(xué)知識(shí)圖譜。這些積累。
黏住產(chǎn)業(yè)的“厚雪”,做實(shí)大模型的技術(shù)紅利,是這一輪AI熱潮,帶給科技企業(yè)的真正機(jī)遇。
在京東,產(chǎn)業(yè)大模型已經(jīng)從一種技術(shù)設(shè)想,逐漸變?yōu)榍逦陌l(fā)展方向,以及可執(zhí)行的行動(dòng)方案,正在撬動(dòng)產(chǎn)業(yè)AI的下一個(gè)可能。
抱一而為天下式大模型的價(jià)值探索
在年初的熱鬧中保持冷靜,在“百模大戰(zhàn)”來(lái)臨之際,京東卻率先給出了大模型的價(jià)值公式:大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。
當(dāng)下階段,大模型的野蠻生長(zhǎng),已經(jīng)告一段落,走向新的應(yīng)用紀(jì)元。推動(dòng)大模型“從參數(shù)為中心”向“以應(yīng)用為中心”轉(zhuǎn)變,是目前的核心問題。京東憑什么后發(fā)先至?或許是很多讀者心中的“未解之謎”。
但透過 “第一性原理”,我們卻可以看到,京東大模型差異化,是一種“必然”。
京東技術(shù)的“第一性原理”,就是“產(chǎn)業(yè)價(jià)值”。
如京東CEO許冉所說,京東研發(fā)每一項(xiàng)技術(shù),都將產(chǎn)業(yè)屬性作為出發(fā)點(diǎn)、產(chǎn)業(yè)價(jià)值作為目標(biāo):技術(shù)源于產(chǎn)業(yè)需求,歷練于產(chǎn)業(yè)場(chǎng)景,創(chuàng)造產(chǎn)業(yè)價(jià)值。
這個(gè)“第一性原理”,造就了京東大模型的路線分野——產(chǎn)學(xué)研用的高度結(jié)合。
不同的出發(fā)點(diǎn):不同于科研類大模型的“兩耳不聞窗外事”,也不同于行業(yè)大模型的“一心只掃門前雪”,京東從產(chǎn)業(yè)端切入大模型,既需要錘煉基座模型的先進(jìn)技術(shù),又需要考慮為整個(gè)產(chǎn)業(yè)和社會(huì)創(chuàng)造價(jià)值,這條路如同“從北坡等珠峰”,更難也更有價(jià)值。
不同的行路人:看到了路,就需要有攀登的人。以何曉冬博士為代表的京東技術(shù)人,眼中有人間煙火,聚焦產(chǎn)業(yè)場(chǎng)景,服務(wù)京東自己的業(yè)務(wù)需要,技術(shù)在真實(shí)場(chǎng)景中被實(shí)踐打磨,被驗(yàn)證,再解耦賦能其他合作伙伴;眼中也有星辰大海,京東探索研究院當(dāng)技術(shù)剛剛在地平線上露出來(lái)的時(shí)候,就看到五年后可能會(huì)發(fā)生一些革命性的改變,開始前瞻性的布局,大模型就是其中之一,具身智能、多模態(tài)大模型、AGI等,都是京東正在關(guān)注的方向。
不同的路線圖:京東做大模型,不是“無(wú)的放矢”,對(duì)于大模型的應(yīng)用實(shí)踐,已經(jīng)有了明確的“三步走”規(guī)劃,第一步,基于內(nèi)部實(shí)踐構(gòu)建通用大模型;第二步,在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場(chǎng)景大規(guī)模錘煉,融合行業(yè)解決方案對(duì)外輸出;第三步,針對(duì)嚴(yán)肅商業(yè)場(chǎng)景將大模型能力對(duì)外開放。目前,京東云已經(jīng)基于內(nèi)部實(shí)踐構(gòu)建了通用大模型。到今年年底,京東將經(jīng)由高復(fù)雜場(chǎng)景大規(guī)模錘煉,迭代出扎實(shí)的產(chǎn)業(yè)服務(wù),預(yù)計(jì)在2024年初,會(huì)將大模型能力向外部嚴(yán)肅商業(yè)場(chǎng)景開放。目前,京東已經(jīng)走到第二步,并在內(nèi)部取得了豐富的實(shí)踐成果。
以“產(chǎn)業(yè)價(jià)值”作為大模型的“第一性原理”,驅(qū)動(dòng)著京東在大模型領(lǐng)域,走上了差異化的發(fā)展模式,率先完成了產(chǎn)業(yè)價(jià)值的創(chuàng)生和積累,更早進(jìn)入應(yīng)用紀(jì)元。
京東大模型的“價(jià)值雪球”,正以“馬太效應(yīng)”越滾越大,加速駛向千行百業(yè)、人間煙火。抱一而為天下式,大模型的產(chǎn)業(yè)價(jià)值,最終會(huì)凝結(jié)在萬(wàn)千眾生的微笑里。