加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 01、2025 年大模型如何賦能企業(yè)數(shù)字化建設(shè)?
    • 02、2025 年,企業(yè)大模型落地趨勢(shì)
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

2025年AI大模型的趨勢(shì)與洞察

12/17 09:50
370
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

2025 年大模型技術(shù)在應(yīng)用側(cè)的新趨勢(shì)是什么?哪些新的技術(shù)方向值得關(guān)注?企業(yè)在規(guī)劃? 2025 年數(shù)字化項(xiàng)目時(shí)有哪些核心關(guān)注點(diǎn)?本文將基于愛分析與企業(yè)用戶、模型廠商的調(diào)研交流中,抽象和總結(jié)出 2025 年的趨勢(shì)和洞察,供大家參考。

分享嘉賓|張揚(yáng)?愛分析 聯(lián)合創(chuàng)始人兼首席分析師

 

01、2025 年大模型如何賦能企業(yè)數(shù)字化建設(shè)?

從數(shù)字化的核心主導(dǎo)方針來(lái)看,2025 年已經(jīng)明確圍繞價(jià)值創(chuàng)造展開。

宏觀環(huán)境方面,在今年四季度初時(shí),大家對(duì)于政策有良好的預(yù)期,但從實(shí)際落地的角度來(lái)看,很多企業(yè)用戶、廠商用戶從政府側(cè)回款的周期還是比較緩慢,盡管已經(jīng)有 10 萬(wàn)億的投放預(yù)期,但實(shí)際的業(yè)務(wù)變化以及經(jīng)營(yíng)狀況的變化,在 2025 年還是緩慢恢復(fù)的過程。

所以在 2025 年大家做數(shù)字化規(guī)劃時(shí),應(yīng)該以創(chuàng)造價(jià)值為核心導(dǎo)向,更多的關(guān)注業(yè)務(wù)收益,以及重點(diǎn)關(guān)注技術(shù)對(duì)于業(yè)務(wù)收益創(chuàng)造有哪些核心點(diǎn)。

大模型2025 年技術(shù)趨勢(shì)

上圖左邊的技術(shù)架構(gòu)是大模型完整的全鏈路技術(shù)架構(gòu),從上層的戰(zhàn)略域,到下轄的應(yīng)用域和管理域,再到基礎(chǔ)的框架域、能力域,和與框架域、能力域并行的上下文域,以及最底下的基礎(chǔ)設(shè)施的計(jì)算域。從中我們總結(jié)了幾點(diǎn)核心的技術(shù)趨勢(shì)。

第一是戰(zhàn)略域,是從整個(gè)大模型的技術(shù)架構(gòu)探索的一個(gè)新方向。

所謂的快思考和慢思考主要映射的是人體大腦的兩個(gè)系統(tǒng),一個(gè)是靠直覺,一個(gè)是靠推理。直覺系統(tǒng)可以理解為快思考的系統(tǒng),推理系統(tǒng)可以理解為慢思考的系統(tǒng)。過去大模型的生成能力基本是圍繞快思考的方向展開的,類似于利用人腦系統(tǒng)里面的直覺去做。對(duì)于要求響應(yīng)速度快,或者業(yè)務(wù)場(chǎng)景沒有太復(fù)雜的企業(yè)應(yīng)用,快思考會(huì)比較適合。例如大家現(xiàn)在用的知識(shí)庫(kù)、內(nèi)容生成、營(yíng)銷素材生成、視頻生成等,都適用直覺的快思考的方式。而對(duì)于復(fù)雜的業(yè)務(wù)場(chǎng)景,一方面需要有大量的業(yè)務(wù) KnowHow 和業(yè)務(wù)知識(shí),另外一方面也需要有比較完整的思考邏輯,也就是推理邏輯。在過去的大模型應(yīng)用落地時(shí)有很大的欠缺,很多企業(yè)也在通過做預(yù)訓(xùn)練或者微調(diào)嘗試彌補(bǔ)專業(yè)知識(shí)的差距,都屬于從框架域和能力域的角度來(lái)解決問題。如果以更高維度的戰(zhàn)略域角度出發(fā),更多是企業(yè)內(nèi)在邏輯推理過程的理解。不管是用思維鏈的方式,還是把整個(gè)思考推理的邏輯訓(xùn)練到模型里,要遠(yuǎn)比純粹的知識(shí)訓(xùn)練維度更高。這也就是從ChatGPT 4-o 提出的慢思考過程,在整個(gè)企業(yè)的大模型技術(shù)架構(gòu)里,不只有直接的推理,還有很多思維鏈的邏輯推理,這就更適合復(fù)雜的業(yè)務(wù)場(chǎng)景,例如可以用大模型做數(shù)據(jù)分析背后更加深入的下鉆、歸因、根因分析,包括潛在的應(yīng)對(duì)解決方案的分析。所以從模型推理的場(chǎng)景角度來(lái)看,會(huì)因?yàn)槁伎嫉募尤耄?025 年大模型的應(yīng)用將逐步深入到企業(yè)更加復(fù)雜的業(yè)務(wù)場(chǎng)景里。

第二是框架域,框架域的兩個(gè)核心點(diǎn),一個(gè)是Agent,一個(gè)是RAG

RAG 在 2025 年核心趨勢(shì)的判斷是 RAG 的工程化會(huì)越來(lái)越成熟,幻覺的消除更多是時(shí)間長(zhǎng)短的問題。從消除幻覺的理論基礎(chǔ)上是比較容易理解和成熟的,本質(zhì)是當(dāng)有理有據(jù)的專家知識(shí)輸入時(shí),模型的幻覺會(huì)自然消失。所以在實(shí)踐落地的過程中, RAG 具體的工程化策略中,消除幻覺是需要長(zhǎng)時(shí)間且逐步成熟的過程。今年我們看到基于傳統(tǒng) RAG 已經(jīng)提升到 RAG 2.0,還有 Graph RAG 和新提出來(lái)的雙層信息過濾框架,這些不同的 RAG 路線,可以理解為不同的工程化策略和手段,這些工程化的策略和手段目前已經(jīng)很豐富,而且依然不停地有新的工程化路線出來(lái),也意味著這些工程化手段的落地門檻,或者落地工具也會(huì)越來(lái)越成熟。所以預(yù)計(jì)在 2025 年末,隨著工程化手段的增加和工程化本身的能力提升,基本消除幻覺問題是可以做到的。以及企業(yè)用戶對(duì)于準(zhǔn)確性的關(guān)注度將會(huì)降低,不再是第一位考慮的問題,因?yàn)樵谝恍?fù)雜場(chǎng)景里是無(wú)法 100% 解決幻覺的,但可能在絕大部分場(chǎng)景里,幻覺將不再是一個(gè)問題。

第三是能力域,包括多模態(tài)的視頻模態(tài)和端側(cè)大模型。

多模態(tài)的視頻模態(tài)肯定是 2025 年最核心最大的能力突破。一些大模型廠商、基模廠商的下一步將重點(diǎn)做這個(gè)方向,以及 2025 年一些 To C 的新場(chǎng)景迸發(fā)出來(lái),基本也是在多模態(tài)領(lǐng)域。舉個(gè)例子,短視頻核心的組成元素包括背景音樂、文本腳本、真人表演。目前文本生成已經(jīng)不成問題,背景音樂從技術(shù)能力角度來(lái)看,大模型生成的音樂不管是從音樂多樣性的風(fēng)格,還是音樂的成熟度,都已經(jīng)比較高了,只不過是欠缺一個(gè)爆款音樂的出現(xiàn),所以核心要解決的是自動(dòng)化生成視頻。從 C 端的應(yīng)用角度來(lái)看,一些成熟的視頻大廠,以及基模廠商,都將會(huì)在 2025 年重點(diǎn)突破和關(guān)注這個(gè)方向。

2025 年消費(fèi)級(jí)AI手機(jī)逐步成熟,端側(cè)大模型向企業(yè)場(chǎng)景滲透

當(dāng)前端側(cè)大模型的場(chǎng)景出現(xiàn)的比較少,但是從未來(lái)的角度來(lái)說,尤其是在 2025 年,端側(cè)大模型的滲透會(huì)呈現(xiàn)比較明顯的增長(zhǎng)趨勢(shì)。原因之一:隨著消費(fèi)場(chǎng)景的變化,2025 年發(fā)售的手機(jī)將變成 AI 手機(jī)。端側(cè)的大模型會(huì)成為AI手機(jī)的標(biāo)配,模型量化技術(shù)的成熟度在 2025 年會(huì)越來(lái)越高,尤其是在手機(jī)的端側(cè)模型中。原因之二:芯片廠商有足夠強(qiáng)的芯片設(shè)計(jì)適配,目前模型廠商和芯片廠商也有一些比較好的組合方式,正在向手機(jī)廠商做端側(cè)模型的輸出。

端側(cè)模型在企業(yè)場(chǎng)景中也滲透了三個(gè)核心場(chǎng)景。

第一是一線人員的作業(yè)場(chǎng)景。過去人員作業(yè)是紙質(zhì)的,有了手機(jī)之后變成移動(dòng)終端,現(xiàn)在是從移動(dòng)終端再一次升級(jí)成智能終端。

第二是在設(shè)備作業(yè)場(chǎng)景。一線有大量的設(shè)備作業(yè)場(chǎng)景,跟人員作業(yè)的場(chǎng)景邏輯類似,面對(duì)設(shè)備自身的生產(chǎn)控制、設(shè)備自身的維修時(shí),設(shè)備自身的智能化能力越強(qiáng),便可以預(yù)見性的提前發(fā)現(xiàn)問題,包括生產(chǎn)過程中生產(chǎn)質(zhì)量的自檢,也可以成為端側(cè)模型應(yīng)用的方向之一。

第三是圍繞端側(cè)的決策分析。典型的是設(shè)備能耗管理,或者車機(jī)端的輔助駕駛,或者人工交互展開的角色分析場(chǎng)景,也是比較好的應(yīng)用方向。總的來(lái)說,從人員作業(yè)、設(shè)備作業(yè)和角色分析場(chǎng)景都是 2025 年比較好的應(yīng)用和突破方向,同時(shí)降本的效果也會(huì)比較明顯。

02、2025 年,企業(yè)大模型落地趨勢(shì)

首先是對(duì)企業(yè)模型支出方面的影響。2025 年會(huì)因?yàn)榇蟓h(huán)境的影響,企業(yè)IT預(yù)算會(huì)呈現(xiàn)微降的趨勢(shì)。但從實(shí)際預(yù)算的投入項(xiàng)拆分來(lái)看,第一個(gè)傳統(tǒng)的業(yè)務(wù)系統(tǒng)改造和升級(jí)依然是最大的支出項(xiàng),第二個(gè)是國(guó)家要求的信創(chuàng)部分也是一大支出,第三個(gè)是大模型,也是唯一一個(gè) it 預(yù)算正增長(zhǎng)的方向。預(yù)估 2025 年實(shí)際支出的增速能夠接近 100% ,做到 238 億元的級(jí)別。

從企業(yè)點(diǎn)角度會(huì)更加看重業(yè)務(wù)的短期收益,會(huì)在大模型軟件和服務(wù)上占更高比例的投入,而在硬件層面投入會(huì)趨于平緩。同時(shí)一部分已經(jīng)完成規(guī)劃的企業(yè),在大模型支出部分會(huì)維持在 5% ~ 10% 的it支出比例,這也可以給到正在做規(guī)劃的企業(yè)一個(gè)參考。接下來(lái)重點(diǎn)分析大模型落地部分的調(diào)研。

首先是落地的階段,在 2025 年處于觀望學(xué)習(xí)的企業(yè)不足30%,有 20% 的企業(yè)會(huì)到試點(diǎn)速贏的階段,也就是從早期的探索可研到試點(diǎn)速贏的過程中。所以明年將是大模型產(chǎn)品跨越鴻溝的一年,也是比較關(guān)鍵的一年。其次是落地手段,沒有太大的變化,大部分企業(yè)采取私有化部署開源模型+應(yīng)用定制開發(fā)的落地手段。再?gòu)穆涞啬康膩?lái)看,圍繞創(chuàng)造價(jià)值展開的增收還是比較困難的,所以最核心的創(chuàng)造價(jià)值還是圍繞降本和提升利潤(rùn)展開。

最后是大模型落地的風(fēng)險(xiǎn)點(diǎn),當(dāng)前準(zhǔn)確性/幻覺是第一位,但也看到數(shù)據(jù)和知識(shí)質(zhì)量的關(guān)注度有在迅速上升。這些是調(diào)研中定性層面的總結(jié),從落地的實(shí)際業(yè)務(wù)場(chǎng)景中,我們核心看到產(chǎn)研和科研場(chǎng)景的價(jià)值已得到企業(yè)用戶認(rèn)可。產(chǎn)研和科研本來(lái)就是企業(yè)重點(diǎn)投入的方向,屬于知識(shí)密集型和資金密集型的典型應(yīng)用場(chǎng)景,與大語(yǔ)言模型的相關(guān)性和適應(yīng)程度比較高,所以產(chǎn)研和科研是值得企業(yè)用戶 2025 年重點(diǎn)嘗試的場(chǎng)景。企業(yè)用戶對(duì)大模型預(yù)期收益會(huì)在 2025 年會(huì)回歸理性。

我們調(diào)研中,對(duì)于已經(jīng)落地大模型的企業(yè),了解到項(xiàng)目預(yù)期收益達(dá)成情況中,少部分實(shí)現(xiàn)和完全未實(shí)現(xiàn)的占比28%,近 1/ 3。這其中可以看到大模型落地的實(shí)際價(jià)值,與企業(yè)用戶的預(yù)期之間還是有一定差距的,在 2025 年時(shí),這個(gè)差距會(huì)是比較良性的。同時(shí)在 2025 年也會(huì)出現(xiàn)一些大模型實(shí)際收益沒有達(dá)到預(yù)期的場(chǎng)景案例,這其實(shí)對(duì)于整個(gè)行業(yè)的發(fā)展還是比較正向和健康的。

主要有兩個(gè)核心的原因:

第一個(gè)核心原因是 ROI 的問題,即投入太高以及對(duì)應(yīng)產(chǎn)出太低。例如 10 倍算力的投入支出只帶來(lái)了 KPI 提升的 10% ,這個(gè)就是典型的 ROI 太低的情況。而在 2025 年基本上已經(jīng)能很穩(wěn)健地去解決這個(gè)問題了,因?yàn)榛A(chǔ)硬件設(shè)施的投入會(huì)縮減,企業(yè)用戶會(huì)更注重些能看到立竿見影效果的場(chǎng)景應(yīng)用,對(duì)于大規(guī)模、長(zhǎng)周期見效的技術(shù)設(shè)施投入接受度會(huì)比較低,所以這是能自然而然隨著企業(yè)用戶對(duì)于 IT 預(yù)算分布和 IT 預(yù)算投項(xiàng)變化而直接能解決的問題。

第二個(gè)是本地化部署和模型能力之間的掣肘與制約問題。比較典型的是測(cè)試的時(shí)候,用公有云的模型測(cè)試效果不錯(cuò),但是本地化部署上線的手段會(huì)導(dǎo)致模型能力的下降,下降的比例或者下降的程度根據(jù)不同的項(xiàng)目有所區(qū)別,這是不及企業(yè)用戶預(yù)期的另一個(gè)核心原因。而且本地化部署的落地手段不會(huì)因?yàn)樾Ч患邦A(yù)期從而發(fā)生任何變化,明年以及未來(lái)幾年都會(huì)以本地化部署為導(dǎo)向。從完整的模型效果來(lái)講,30%-40% 是由基礎(chǔ)模型決定的,30%-40% 是由 RAG 決定的,剩下的 20%-30% 是由微調(diào)決定的。

所以隨著 RAG 的逐漸成熟,想要改善模型效果,一方面可以利用微調(diào)做一些補(bǔ)充,需要等待微調(diào)工具鏈的進(jìn)一步成熟,這也是改善本地化部署與模型能力掣肘的有效方式。另外一方面是應(yīng)用工程化的成熟度,隨著企業(yè)搭建越來(lái)越多的應(yīng)用,通用性會(huì)越來(lái)越強(qiáng),可以將模型能力轉(zhuǎn)移到應(yīng)用中解決,不一定全部依托于模型能力,應(yīng)用的工程化的、成熟度的提高也能解決預(yù)期收益達(dá)成的問題,但這個(gè)問題可能需要兩年甚至三年的時(shí)間來(lái)長(zhǎng)期解決??偟膩?lái)看,大模型的預(yù)期收益會(huì)在 2025 年逐漸回歸理性。以上就是此次分享的內(nèi)容。

畢業(yè)于清華大學(xué)及香港中文大學(xué),杭州市金融科技創(chuàng)新項(xiàng)目應(yīng)用案例專家評(píng)委,原投中集團(tuán)副總裁。十余年金融行業(yè)從業(yè)經(jīng)驗(yàn),在愛分析媒體平臺(tái)發(fā)文超過 500 篇,有很深的行業(yè)影響力。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

愛分析是一家專注數(shù)字化市場(chǎng)的研究咨詢機(jī)構(gòu),成立于中國(guó)數(shù)字化興起之時(shí),致力于成為決策者最值得信任的數(shù)字化智囊。憑借對(duì)新興技術(shù)和應(yīng)用的系統(tǒng)研究,對(duì)行業(yè)和場(chǎng)景的深刻洞見,愛分析為數(shù)字化大潮中的企業(yè)用戶、廠商和投資機(jī)構(gòu),提供專業(yè)、客觀、可靠的第三方研究與咨詢服務(wù),助力決策者洞察數(shù)字化趨勢(shì),擁抱數(shù)字化機(jī)會(huì),引領(lǐng)中國(guó)企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)。