作者?|??云鵬? ?編輯?|??漠影
秒懂你的想法,一句話生成圖文,更聰明懂你的智慧助手已經(jīng)走入現(xiàn)實(shí)。
在今天的AI大模型時(shí)代,AI和終端場(chǎng)景要如何結(jié)合才能真正為我們的生活帶來便利?這是當(dāng)下每一家科技巨頭都在思考和面對(duì)的問題。
在大模型落地千行百業(yè)的大潮之下,智能手機(jī)作為與普通消費(fèi)者生活最為貼近的產(chǎn)品,也在快速卷入AI革命的浪潮中。
iOS版、安卓版ChatGPT的先后發(fā)布讓更多人可以接觸到大模型帶來的技術(shù)紅利,而語音助手與大模型的結(jié)合也成為科技巨頭們正在爭(zhēng)奪的關(guān)鍵高地。
一邊谷歌計(jì)劃徹底重塑其智能語音助手,將大模型能力融入,另一邊蘋果Siri也曾被多次曝光將融入大模型相關(guān)能力,微軟的Copilot則已經(jīng)完成對(duì)Cortana的替代。
終端設(shè)備中的AI迎來一場(chǎng)大模型革命,已成大勢(shì)所趨。一直被消費(fèi)者詬病不夠“智能”的語音助手,究竟要如何借助大模型變得“更智能”?
就在8月4日,華為率先交出了一份答卷。
在華為盤古L0基座大模型的基礎(chǔ)上,華為針對(duì)終端消費(fèi)者場(chǎng)景構(gòu)建了大量的場(chǎng)景數(shù)據(jù)與精調(diào)模型后的L1層對(duì)話模型,并將該模型用在了智慧助手小藝中,全新的小藝在今年華為開發(fā)者大會(huì)上正式亮相。
基于此,華為也成為國(guó)內(nèi)率先將大模型能力融入智慧助手并面向消費(fèi)者落地的科技公司。
用華為的話來說,在大模型的加持下,小藝變得“更聰明、更能干、更貼心”了?;谌A為大模型和AI技術(shù)的進(jìn)步,小藝迎來了一次顛覆性的智能化革新,而這些新體驗(yàn),也將進(jìn)一步擴(kuò)展至華為“1+8”的產(chǎn)品生態(tài)中。
大模型的融入究竟能給如今的智慧助手們帶來怎樣的“進(jìn)化”?華為是如何克服重重行業(yè)此前未能突破的難題將大模型成功落地在終端中的?小藝掀起的智能語音助手新革命又將對(duì)產(chǎn)業(yè)有著怎樣深遠(yuǎn)的影響?
可以確定的是,讓智慧助手給我們每個(gè)人的日常生活真正帶來便利和樂趣,華為把這件事又往前推了一大步。
01.語言理解力暴漲,人人化身玩機(jī)達(dá)人? 小藝變得更聰明了
從大模型進(jìn)入大眾視野的第一天起,一個(gè)討論就從未停息:由大模型驅(qū)動(dòng)的聊天機(jī)器人是否會(huì)取代手機(jī)上的智慧助手?
今天,從華為給出的答案來看,兩者絕非替代關(guān)系,由大模型賦能的智慧助手能夠帶來的體驗(yàn)革新,可以說讓許多曾經(jīng)的“想象”真正走入了“現(xiàn)實(shí)”。智慧助手越來越像你真正的管家、朋友,人工智能的“智能化”邁入了新的階段。
縱觀小藝的升級(jí),最直觀的體現(xiàn)就是:小藝真的變“聰明”了,它知道我在說什么、能夠更精準(zhǔn)地讀懂我話里的意思了。
比如我可以直接跟小藝說,“能不能把手機(jī)壁紙?jiān)O(shè)置成實(shí)時(shí)天氣?”此時(shí)小藝就能明白我是想要全景天氣壁紙。
對(duì)于再?gòu)?fù)雜一點(diǎn)的場(chǎng)景,比如今晚我想請(qǐng)人吃飯,就可以直接跟小藝說,“找一家附近評(píng)分高的海鮮餐廳,最好有適合四個(gè)人的優(yōu)惠套餐”,此時(shí)小藝可以準(zhǔn)確理解我的意圖,并直接調(diào)用美團(tuán)服務(wù)給我找到相關(guān)餐廳。
當(dāng)我隨手拍一個(gè)海報(bào),針對(duì)海報(bào)圖片,就可以用自然交流的方式去問小藝相關(guān)的信息并獲取服務(wù),比如我可以跟小藝說,“我想?yún)⒓蛹夹g(shù)論壇,導(dǎo)航去圖上的地址”,此時(shí)小藝就可以準(zhǔn)確識(shí)別海報(bào)中的地址信息并打開導(dǎo)航App進(jìn)行導(dǎo)航。
在大模型能力的加持下,小藝還可以處理更加復(fù)雜的場(chǎng)景編排任務(wù),幫我們創(chuàng)造專屬于自己的特殊場(chǎng)景。如果喜歡運(yùn)動(dòng)健身,我可以讓小藝創(chuàng)建一個(gè)“晨跑場(chǎng)景”,要求為“每周一到周五早上6點(diǎn)半為我播報(bào)當(dāng)天天氣,6點(diǎn)半到7點(diǎn)我會(huì)跑步,當(dāng)我戴上藍(lán)牙耳機(jī)的時(shí)候,就播放收藏的歌曲,并把手機(jī)設(shè)置為靜音模式”。
這一系列看似復(fù)雜的操作,都可以通過這“一句話的時(shí)間”讓小藝直接設(shè)置完成。可以說,在“更聰明”的小藝的幫助下,我們不再需要一項(xiàng)項(xiàng)地查看玩機(jī)技巧和大量的功能說明,每個(gè)人都可以成為“玩機(jī)達(dá)人”,因?yàn)槲覀冎恍枰獑栃∷嚲涂梢粤恕?/p>
小藝這種能力的提升,讓很多智能手機(jī)具有的強(qiáng)大功能,可以簡(jiǎn)單便捷地、通過語音口述的方式被用戶所接觸到。
縱觀小藝在“更聰明”層面的諸多升級(jí),我們能清晰地看到,大模型能力的融入,搬開了阻礙用戶養(yǎng)成智慧助手使用習(xí)慣的最大絆腳石之一——不夠自然的對(duì)話、無法隨心所欲的自然交流。
想要真正讓智能語音助手從好玩、新奇走向好用,甚至成為一種“習(xí)慣動(dòng)作”,優(yōu)秀的語言理解和交互能力是必不可少的。大模型讓智能語音助手真正能夠讀懂、聽懂我們,其易用性的提升是極為顯著的。
02.數(shù)千字文章秒生摘要 圖文多模創(chuàng)作不在話下,小藝更能干了
除了自然語言理解能力的跨越式迭代,大模型加持下的小藝在生產(chǎn)力方面效率提升也十分可觀,這也是大模型應(yīng)用的強(qiáng)項(xiàng)之一,智能語音助手終于可以參與到我們平時(shí)工作的具體內(nèi)容中來了。
比如當(dāng)我們?cè)谝恍﹥?nèi)容資訊App上看到一篇文章,就可以問小藝,“這篇文章主要講了什么”,此時(shí)小藝就可以快速對(duì)文章內(nèi)容進(jìn)行重點(diǎn)總結(jié)并生成簡(jiǎn)短的摘要。
根據(jù)華為在開發(fā)者大會(huì)上的演示,對(duì)于一篇3000多字的文章,一次輸入給模型,模型可以在幾秒之內(nèi)完成對(duì)文章的總結(jié)。
我們還可以進(jìn)一步針對(duì)這篇文章的內(nèi)容去延伸問一些問題,小藝都可以從文章中找到相關(guān)信息組成簡(jiǎn)潔明了的答案呈現(xiàn)給我們。
不僅是文章、新聞,小藝甚至還可以讀論文,可以說,在大模型能力的加持下,每個(gè)人都有機(jī)會(huì)在小藝的幫助下不斷地提升自己的能力。
除了理解文章,小藝還可以“寫文章”。當(dāng)我要和一個(gè)初次見面的合作伙伴開會(huì)時(shí),我可以直接跟小藝口述會(huì)議的時(shí)間、邀請(qǐng)的公司人員以及討論內(nèi)容,小藝就會(huì)幫我寫一封會(huì)議邀請(qǐng)的郵件。
據(jù)了解,目前小藝已經(jīng)學(xué)習(xí)了上百種的文案風(fēng)格,包括各類書信、公文、商業(yè)文案、祝福語、故事、工作總結(jié)等。
其實(shí)不只是文字,對(duì)于圖片的生成和創(chuàng)作,小藝同樣拿手。比如在特定的節(jié)日,我只要把相關(guān)主題、風(fēng)格告訴小藝,小藝就可以根據(jù)我的照片,一鍵生成一張屬于我的創(chuàng)意卡片。借助多模態(tài)大模型技術(shù),小藝無疑可以幫我們更好地使用手機(jī)里的大量影像素材。
縱觀小藝在辦公生產(chǎn)力方面的提升,可以說小藝已經(jīng)不僅是生活中懂我的朋友,更是我們工作中的得力助手。大模型能力的融入顯著促進(jìn)了智慧助手生產(chǎn)效率的提升。
在當(dāng)下這個(gè)快節(jié)奏的時(shí)代,小藝快速提供靈感、輔助創(chuàng)作、節(jié)省時(shí)間獲取關(guān)鍵信息的這一系列能力,都顯得十分“需求對(duì)口”。
大模型讓智能語音助手從“需要”變?yōu)椤氨匾保瑥摹澳苡谩弊優(yōu)椤昂糜谩?,?shí)用性得到了顯著提升。
03.從通用到“專屬”,AI也可以更有溫度
在大模型的加持下,小藝在各方面的能力都有了長(zhǎng)足進(jìn)步,而當(dāng)我們將時(shí)間線拉長(zhǎng),我們還能看到“進(jìn)化”后的小藝帶來的更深層價(jià)值。
隨著小藝與我們相處的時(shí)間越來越長(zhǎng),我們和小藝不斷地交流,小藝就會(huì)變得越來越懂我們,給出的建議也會(huì)更加貼心和個(gè)性化,從一個(gè)通用智慧助手變?yōu)槲业?strong>“專屬貼心管家”。
比如我在開會(huì)時(shí)有一些待辦事項(xiàng),可以通過“隨口描述”的方式讓小藝記錄下來,小藝可以對(duì)我口述的內(nèi)容進(jìn)行理解,并將這些重要事項(xiàng)提煉出來,放在日歷或者備忘錄中。
這還沒完,等過一段時(shí)間,如果我還要根據(jù)上次開會(huì)的待辦事項(xiàng),再次與合作伙伴開會(huì),我就可以讓小藝根據(jù)之前記錄的信息直接寫出一封新的會(huì)議邀請(qǐng)郵件。
當(dāng)然,對(duì)于生活中的一些重要時(shí)刻,比如父母的生日,小藝可以幫我記住,并且在提醒的同時(shí),為我提供更多的服務(wù)推薦,比如餐廳的選擇、禮物的購(gòu)買建議,這些服務(wù)可以一觸直達(dá)對(duì)應(yīng)的App。
此外,當(dāng)我們出差時(shí),如果我是一個(gè)喜歡美食的人,小藝就會(huì)幫我推薦一些當(dāng)?shù)氐拿朗常绻∷嚧饲爸牢蚁矚g旅游,它就會(huì)給我介紹一些當(dāng)?shù)氐木包c(diǎn)。
當(dāng)小藝對(duì)我們更了解的時(shí)候,小藝提出的建議也會(huì)更加個(gè)性化,有更高的概率契合我們當(dāng)下的實(shí)際需求。
值得一提的是,小藝相關(guān)的個(gè)性化數(shù)據(jù)和學(xué)習(xí)都是在端側(cè)進(jìn)行的處理的,從而保證數(shù)據(jù)的安全和隱私。在華為看來,安全與隱私保護(hù)是他們?cè)谒蠥I場(chǎng)景設(shè)計(jì)和體驗(yàn)創(chuàng)新中遵循的第一原則。AI不能無中生有,更不能被濫用,AI是輔助而不是替代,AI是增強(qiáng)而不是虛構(gòu)。
正如華為所思考的一樣,在AI技術(shù)高速發(fā)展的當(dāng)下,用更負(fù)責(zé)任地態(tài)度去做更透明的AI,審慎創(chuàng)新善用AI,必然是所有科技企業(yè)都應(yīng)堅(jiān)持的方向。
04.重構(gòu)大模型與智慧助手? 顛覆體驗(yàn)離不開硬核技術(shù)創(chuàng)新
不論是更聰明、更能干的小藝,還是更個(gè)性化、更貼心的小藝,抑或是語音交流更加逼真、更有溫度的小藝,大模型正讓智能語音助手變得更加易用、實(shí)用、好用,從根本上解決用戶使用語音助手中遇到的諸多“頑疾”,帶來體驗(yàn)上的“質(zhì)變”。
而在這種質(zhì)變的背后,華為在硬核技術(shù)層面的積累和創(chuàng)新無疑是關(guān)鍵支撐。
實(shí)際上,華為從底層就重構(gòu)了大模型與智慧助手的整個(gè)協(xié)作系統(tǒng),摒棄了過去多個(gè)系統(tǒng)獨(dú)立構(gòu)建的“割裂”模式,讓大模型成為智慧系統(tǒng)的大腦,以大模型為核心,無縫利用大模型的高階能力,對(duì)系統(tǒng)進(jìn)行全面增強(qiáng)。
這一架構(gòu)方向挑戰(zhàn)巨大,此前業(yè)界沒有成熟的商用案例,但華為仍然決定做“第一個(gè)吃螃蟹的人”。
為此華為構(gòu)造了各場(chǎng)景下的語料數(shù)據(jù),并設(shè)計(jì)了能讓系統(tǒng)理解、可執(zhí)行的模型輸出,同時(shí)華為給大模型注入了可信的結(jié)構(gòu)化、非結(jié)構(gòu)化知識(shí),讓大模型能夠?qū)W習(xí)到通識(shí)、邏輯關(guān)系。
具體來看,華為在預(yù)訓(xùn)練、設(shè)備操控以及端云協(xié)同方面的突破都可圈可點(diǎn)。
首先,預(yù)訓(xùn)練的能力強(qiáng)不強(qiáng),是對(duì)各家內(nèi)功的真正考驗(yàn)。在預(yù)訓(xùn)練中,華為構(gòu)建大量的不同類型表達(dá)的語料庫(kù),讓大模型在預(yù)訓(xùn)練的階段中就成為精通各類表達(dá)的大師。
同時(shí),華為從一開始就希望小藝向著“更智能的私人助理”這一方向去進(jìn)化。為此華為將大模型的能力進(jìn)行細(xì)化拆解,在此基礎(chǔ)上構(gòu)建完整的測(cè)試數(shù)據(jù)集,并使用能力樹指導(dǎo)數(shù)據(jù)構(gòu)建和大模型能力構(gòu)建。
在設(shè)備操控方面,如何利用大模型進(jìn)行設(shè)備控制,實(shí)現(xiàn)真正的智能化設(shè)備控制,是用戶體驗(yàn)?zāi)芊駥?shí)現(xiàn)跨越式升級(jí)的關(guān)鍵。
為此,華為將設(shè)備控制中大模型生成文本的格式做到了幾乎百分百的遵從度,讓中樞系統(tǒng)高效解析和對(duì)接。同時(shí)為了解決場(chǎng)景復(fù)雜的挑戰(zhàn),華為詳細(xì)梳理消費(fèi)者場(chǎng)景制定工具使用說明書,讓大模型“先學(xué)習(xí)再上崗”。
針對(duì)大模型高昂推理成本和推理時(shí)延的難題,華為設(shè)計(jì)了多套完全不同的工具調(diào)用范式,將工具調(diào)用等待時(shí)間加速了一倍。
從最終落地結(jié)果來看,小藝所使用的大模型,可以很好地覆蓋對(duì)話、出行旅游、設(shè)備操控、吃穿住行等各類終端消費(fèi)場(chǎng)景,其知識(shí)范圍、事實(shí)性、實(shí)時(shí)性以及安全合規(guī)等多方面都得到了針對(duì)性優(yōu)化和增強(qiáng)。
最后在端云協(xié)同方面,個(gè)性化數(shù)據(jù)處理需要端側(cè)模型,端側(cè)算力和功耗的限制又使得云側(cè)模型不可或缺。云側(cè)和端側(cè)要如何分配任務(wù)、協(xié)同配合,是對(duì)廠商技術(shù)的考驗(yàn)。華為在大模型端云協(xié)同領(lǐng)域積累的技術(shù)能力,讓個(gè)性化體驗(yàn)得以實(shí)現(xiàn)。
據(jù)了解,針對(duì)消費(fèi)者在不同設(shè)備不同場(chǎng)景下的需求,華為小藝背后的大模型擁有端側(cè)和云側(cè)等形態(tài)。在小藝與大模型的結(jié)合中,端側(cè)大模型會(huì)先對(duì)用戶請(qǐng)求和上下文信息做一層預(yù)處理,再將預(yù)處理后的需求發(fā)送到云側(cè),從而最大化地發(fā)揮“端側(cè)模型快”和“云側(cè)模型強(qiáng)”的優(yōu)勢(shì)。
從重構(gòu)大模型與智慧語音助手的協(xié)同關(guān)系,到克服諸多大模型落地終端場(chǎng)景面臨的技術(shù)挑戰(zhàn),華為還是那個(gè)我們熟悉的華為,技術(shù)創(chuàng)新能力仍然是華為最硬的底牌。
05.打通軟硬全鏈條,讓大模型成為“系統(tǒng)級(jí)”能力,全場(chǎng)景生態(tài)加速落地
正如我們開頭所說,AI和終端場(chǎng)景要如何結(jié)合才能真正為我們的生活帶來便利,是當(dāng)下終端側(cè)AI技術(shù)落地應(yīng)用需要回答的關(guān)鍵問題。
華為小藝的一系列技術(shù)、能力升級(jí),讓我們看到了大模型如何更加貼近消費(fèi)者的使用場(chǎng)景,大模型的應(yīng)用如何“更接地氣”?小藝可以說做了一個(gè)很好的示范。
華為從用戶體驗(yàn)出發(fā),用技術(shù)解決問題,將傳統(tǒng)語音助手在體驗(yàn)上的“不可能”變成了可能。
相比OpenAI的ChatGPT、谷歌的Bard這些生成式AI聊天機(jī)器人,華為的小藝是在HarmonyOS操作系統(tǒng)層面,為華為終端用戶提供語音對(duì)話、圖文識(shí)別、服務(wù)建議、設(shè)備智慧能力開放和設(shè)備互聯(lián)管理的應(yīng)用。
從硬件、軟件、系統(tǒng)到應(yīng)用層全鏈條的打通,華為讓大模型成為“系統(tǒng)級(jí)”能力,這是其他產(chǎn)品所無法比擬的,也是華為的核心優(yōu)勢(shì)之一。
從云端服務(wù)器中的芯片,到終端設(shè)備中的鴻蒙操作系統(tǒng)和鴻蒙應(yīng)用生態(tài),華為這種全棧式技術(shù)能力是小藝與大模型結(jié)合如此高效且順利的關(guān)鍵支撐。
華為相關(guān)AI專家告訴智東西,系統(tǒng)級(jí)的入口跟操作系統(tǒng)結(jié)合地更加緊密,跟生態(tài)的互聯(lián)也做到了系統(tǒng)生態(tài)底層,這種互聯(lián)才是真正高效的。
與此同時(shí),華為小藝基于華為鴻蒙生態(tài)形成的優(yōu)勢(shì)也是其獨(dú)特競(jìng)爭(zhēng)力。
目前華為的各類終端產(chǎn)品面向全場(chǎng)景布局,其中“1+8”這幾類核心產(chǎn)品小藝都已完成覆蓋,未來結(jié)合全場(chǎng)景設(shè)備的業(yè)務(wù)形態(tài),華為能夠?qū)碛写竽P湍芰Φ男∷嚥渴鸬较M(fèi)者全場(chǎng)景體驗(yàn)上。
基于小藝的大模型能力在華為全場(chǎng)景業(yè)務(wù)生態(tài)中全面落地,已經(jīng)只是時(shí)間的問題了。
06.結(jié)語:大模型掀起語音助手進(jìn)化潮? 華為已先行一步
此次基于大模型技術(shù),小藝掌握了更多技能,從更自然流暢的對(duì)話交互到更高效便捷的生產(chǎn)力應(yīng)用,從更懂你的主動(dòng)服務(wù)到更有溫度的個(gè)性化服務(wù),華為已經(jīng)成為科技巨頭中將大模型與端側(cè)用戶體驗(yàn)結(jié)合的最為緊密的一個(gè)。
目前,華為全新的小藝智慧助手將在今年8月底開放邀請(qǐng)測(cè)試,并于晚些時(shí)候在搭載HarmonyOS 4.0及以上操作系統(tǒng)的部分機(jī)型中通過OTA升級(jí),具體升級(jí)計(jì)劃會(huì)稍晚公布。
真正讓大模型服務(wù)于普通消費(fèi)者,讓每個(gè)人享受到生成式AI帶來的體驗(yàn)革新,這是小藝對(duì)于產(chǎn)業(yè)和用戶最大的價(jià)值所在。
面向未來,大模型與智能語音助手的結(jié)合必將更加緊密,隨著后續(xù)各路科技巨頭的跟進(jìn),智能語音助手的“進(jìn)化”浪潮將勢(shì)不可擋。未來還會(huì)有哪些新的應(yīng)用場(chǎng)景、新的應(yīng)用形態(tài)和功能涌現(xiàn)出來,都令人充滿想象空間。