大模型演進至今,尋求殺手級應用成為業(yè)界共同面臨的核心命題。2024年上半年,大模型價格戰(zhàn)“打”的轟轟烈烈。而到了下半年,幾乎人人都在談“AI Agent”(人工智能代理,也可稱為“智能體”)。在海外市場,微軟、蘋果、谷歌、OpenAI、Anthropic等科技巨頭紛紛公布相關進展;在國內(nèi)市場,百度、阿里、騰訊、智譜、榮耀、聯(lián)想等一眾廠商的智能體平臺也紛至杳來,一場圍繞“AI Agent”的爭奪戰(zhàn)正悄然開啟。
AI Agent成為“新風口”
繼LLM(大語言模型)之后,AI Agent儼然成為了AI產(chǎn)業(yè)發(fā)展的新風口。OpenAI CEO Sam Altman認為“Agent 將成為下一個重大突破”。中國工程院院士鄔賀銓指出,AI Agent是大模型落地載體的關鍵作用。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏更是直言:“Agent是我們最看好的AI應用發(fā)展方向?!?/p>
此外,比爾蓋茨、吳恩達、李飛飛等多位AI領域的知名專家均公開表示AI Agent是重要發(fā)展方向。被這些科技大佬們共同看好的“AI Agent”究竟是什么?OpenAI將“AI Agent”定義為以LLM為大腦驅動,具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動化執(zhí)行復雜任務的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent 具備通過獨立思考、調(diào)用工具去逐步完成給定目標的能力。
舉個簡單的例子,如果用戶想要進行一次家庭聚餐,LLM可以為其提供就餐地點和店鋪相關信息提示,而AI Agent不僅能夠提供擇店鋪建議,還能基于用戶預算搜索菜系和店鋪,執(zhí)行預訂操作,并將行程添加到日歷,還可以發(fā)送行程提醒。有觀點認為,?AI Agent的出現(xiàn)是為了解決LLM在具體應用場景中的局限性。LLM雖然具備了一定的智能,能夠生成文本、圖片和視頻等內(nèi)容,但其功能相對有限,無法獨立完成復雜的任務。AI Agent作為大模型的上層應用,能夠通過感知環(huán)境、進行決策和執(zhí)行動作,幫助大模型實現(xiàn)更多的功能,從而更好地為各行各業(yè)賦能。
換句話說,LLM就像一個“超級大腦”,知識豐富、能力強大,但它“只懂回答,不懂行動”。而AI Agent(智能體)不僅有聰明的“大腦”,能回答問題,還有靈活的“手腳”,能像人一樣主動完成一系列關聯(lián)性的任務,必要的時候還會使用“工具”?!癆I Agent是通往AGI(通用人工智能)的重要一步?!敝亲VAI CEO張鵬表示。他認為,AI Agent代表的是一種未來真正的人機交互方式,即讓機器來適應人,它能夠讓大模型從“Chat(對話)”走向真正的“Act(操作)”。?
誰將主導AGI入口之戰(zhàn)?
市場研究機構Gartner將Agentic AI列為2025年十大技術趨勢之一,并預測到2028年,至少有15%的日常工作決策將由Agentic AI(人工智能代理,同“AI Agent”)自主完成。Salesforce AI Research 執(zhí)行副總裁兼首席科學家Silvio Savarese指出,Agentic AI階段“正轉向使用人工智能來自動化整個任務并代表我們采取行動”,與以前的人工智能相比是一場重大的能力飛躍。
盡管現(xiàn)階段技術還比較初期,但AI Agent的未來應用已經(jīng)展現(xiàn)出了強大的前景。理論上講,隨著AI Agent的能力繼續(xù)提升,它們將能調(diào)用越來越多的應用,適配越來越多的操作系統(tǒng),實現(xiàn)越來越復雜的連貫自主操作。業(yè)內(nèi)專家預判,作為連接用戶和服務的“橋梁”,AI Agent將持續(xù)進化,成為通往AGI(通用人工智能)的重要入口。也正因如此,無論是大模型創(chuàng)業(yè)公司、互聯(lián)網(wǎng)大廠、軟件應用商,還是傳統(tǒng)硬件廠商都在試圖抓住這個機會,吃到新的入口紅利。
近日,微軟宣布建立全球規(guī)模最大的企業(yè)級AI Agent生態(tài)系統(tǒng)——Copilot Studio平臺,現(xiàn)已有超過十萬家企業(yè)使用該平臺創(chuàng)建或編輯AI Agent。微軟智能體負責人Charles Lamanna透露:“這個增長速度遠超我們的預期,也遠超我們發(fā)布的其他任何前沿技術的表現(xiàn)”。谷歌緊隨其后推出了商用AI Agent市場,提供從AI Agent的開發(fā)、部署到應用一站式商用生態(tài)。OpenAI也計劃在明年1月發(fā)布名為“Operator”的AI Agent工具,能夠在用戶的指示下在計算機上自主完成任務,例如編寫代碼、預定行程。
國內(nèi)廠商也在積極爭奪“話語權”。百度文心智能體平臺、騰訊元器、訊飛星火智能體創(chuàng)作中心、通義智能體、字節(jié)“扣子”等面向B端企業(yè)用戶提供了智能體創(chuàng)建平臺。支付寶旗下AI App支小寶、智譜的智能體AutoGLM以及榮耀的智能體YOYO通過自主點咖啡、發(fā)紅包等操作點燃了C端用戶激情。還有一些硬件廠商也通過智能體初體驗嘗到了“甜頭”,比如比亞迪的官方智能體上線后,銷售線索轉化率提升了119%。聯(lián)想AIPC智能體在今年9月份的互動率提升了89%,銷售線索轉化率提升了80%。目前,關于智能體的探索仍處于初期階段,要想打造出一款真正成熟的超級智能體,并實現(xiàn)大規(guī)模商業(yè)化應用還需要時間。不過,這對于所有參與競爭的廠商而言,也是機會所在。
將給產(chǎn)業(yè)帶來哪些影響?
“我們現(xiàn)在已經(jīng)達到了大模型的上限,AI的未來在于自主工作的智能體?!盨alesforce首席執(zhí)行官Marc Benioff表示,過去幾年,“我們都沉迷于ChatGPT的魔力”,導致普通消費者認為大模型是推動技術進步的關鍵。實際上,對于那些希望提高效率并改變工作模式的公司來說,AI智能體的實際應用將比大模型更重要。德勤AI研究院發(fā)布的最新報告指出,AI智能體正在重塑工作的未來。
未來AI智能體將改變基礎業(yè)務模式和整個行業(yè),實現(xiàn)新的工作、運營和價值交付方式?!癆I智能體市場前景非常廣闊,智能體銜接模型層與應用層,是現(xiàn)階段AI大模型應用落地的重要補充,可以應用在多類場景?!敝袊娮由虅諏<曳罩行母敝魅?、資深人工智能專家郭濤表示。
這些應用場景包括但不僅限于以下幾類:一是生活類場景,例如陪伴助教、個人法律顧問、醫(yī)療顧問等;二是辦公類場景,例如AI辦公、數(shù)據(jù)分析等;三是端側應用場景,包括AI手機或電腦、自動駕駛、人形機器人等。以智能手機為例,過去行業(yè)內(nèi)“卷”的中心是各種參數(shù)配置和芯片影像的能力,現(xiàn)在則由AI Agent“接棒”了。
從最新發(fā)布的產(chǎn)品來看,華為Pura70系列將智能助手升級為“小藝智能體”,小米15系列將“小愛同學”升級為全生態(tài)AI智能助手“超級小愛”,榮耀Magic 7將YOYO助理升級為YOYO智能體。
在傳統(tǒng)智能手機端,用戶獲取服務往往依賴各種獨立應用,而AIAgent的加持則將這些服務入口整合在了一起,賦予了智能手機完成更復雜任務的可能性,也意味著手機廠商能借此獲取更多增值服務的機會。像榮耀Magic 7新上線的YOYO智能體便具備模糊理解、界面識別、自動執(zhí)行、一語到位等能力,可以支持單指令系統(tǒng)級任務執(zhí)行、第三方應用任務執(zhí)行甚至多應用協(xié)調(diào)執(zhí)行等多種模式。
榮耀CEO趙明在發(fā)布會現(xiàn)場用Magic7自動下單2000杯瑞幸咖啡送給參會人員,實現(xiàn)了“AI一句話的事兒”,一度引發(fā)行業(yè)熱議?!拔磥淼腁I智能體可能比人類還多,人類將生活在一個有數(shù)億,甚至數(shù)十億AI智能體的世界中?!盡eta CEO扎克伯格判斷稱。
市場研究機構Research and Market最新發(fā)布的報告顯示,AI智能體的市場規(guī)模將從2024年的51億美元增長到2030年的471億美元,年均復合增長率為44.8%??梢钥吹?,AI Agent的爆火帶來了大片市場藍海,但同時也帶來了更多新的挑戰(zhàn)。這一次,究竟誰能在人機交互新時代拔得頭籌,讓我們拭目以待。
作者丨宋婧編輯丨趙晨美編丨馬利亞監(jiān)制丨連曉東