作者 | 董子博
編輯 | 岑峰
“今天的數(shù)字人賽道,不比‘外功’,比的是‘心法’。”
終于有人承認(rèn),自己對(duì)“元宇宙”的前景太過于樂觀。
不過令人大跌眼鏡的是,說出這話的人,是“元宇宙教父”——馬克·扎克伯格,而這句話的背后,是Meta超過11000人的巨幅規(guī)模裁員。
有些諷刺的是,雷峰網(wǎng)先前剛剛和一位Oculus前員工有過接觸,聊到扎克伯格對(duì)元宇宙下重注,他援引了Meta CTO 安德魯博斯沃思評(píng)價(jià)前者的一句話:“很多人低估了扎克伯格投注元宇宙的決心,也有很多人低估了扎克伯格口袋的深度。”
Meta裁員消息一出,科技圈舉目皆驚——經(jīng)濟(jì)下行的“寒氣”,也要傳到元宇宙領(lǐng)域了?
事實(shí)上,進(jìn)入2022年,元宇宙的概念炒作在一級(jí)和二級(jí)市場都有所收縮。然而,在元宇宙底層技術(shù)研發(fā)的賽道上,創(chuàng)新者熱情卻絲毫未減。
Meta萬人裁員一周后,百度則向媒體公布消息——百度的數(shù)字人家族,集體入駐快手平臺(tái),邁出了AIGC數(shù)字人探索的新一步。
說起來,快手上虛擬主播不少,其中佼佼者,熱度絕不輸真人。有媒體報(bào)道,頭部虛擬人主播狐璃璃在快手40天收獲近120萬粉絲,流量不小,競爭也不少。
01、數(shù)字人——“低垂的果實(shí)”?
數(shù)字人,稱得上是元宇宙范疇中最成熟的領(lǐng)域之一——無論是從技術(shù)上,還是從商業(yè)運(yùn)作上,數(shù)字人都更接近C端用戶,變現(xiàn)實(shí)力強(qiáng)勁,應(yīng)用也相當(dāng)廣泛。
有不少人,都將數(shù)字人理解為步向元宇宙路上的“低垂的果實(shí)”,也有不少數(shù)字人廠商通過優(yōu)秀的運(yùn)營手段取得了商業(yè)回報(bào)。
但,現(xiàn)在正有越來越多的人看到,數(shù)字人的成績雖然喜人,但當(dāng)下的模式,終究不是元宇宙的未來。
當(dāng)下大部分的數(shù)字人,仍然由“中之人”驅(qū)動(dòng)——如果沒了動(dòng)作捕捉演員,數(shù)字人就只是一個(gè)沒人操縱的“木偶”。
這種數(shù)字人,就只是給物理的人“穿”上了一層虛擬的“衣服”。還是一個(gè)人,做一個(gè)人能夠做的事情。
有分析機(jī)構(gòu),將現(xiàn)在的數(shù)字人分成兩種,一種是“人格型數(shù)字人”——中之人型的數(shù)字人就屬于此類——主要功能是取悅用戶,在作用上與明星偶像無異。
誠然,人格型虛擬人也有其應(yīng)用場景,市場也十分廣闊。然而,人格型的數(shù)字人模式,相比技術(shù)更重運(yùn)營。本質(zhì)上,也受到中之人或高精度渲染的成本制約,在產(chǎn)能角度受到很大制約。
而第二種數(shù)字人——“服務(wù)型數(shù)字人”就有所不同,此類數(shù)字人以AI技術(shù)驅(qū)動(dòng)。作用上,這種數(shù)字人主要以服務(wù)/替代部分真人工作為出發(fā)點(diǎn),能夠?qū)嶋H達(dá)成降本增效。
簡單舉個(gè)例子,“中之人”型的虛擬主播,仍然受制于“中之人”的體力、能力等問題,需要休息,也可能會(huì)出現(xiàn)失誤和事故;而AI驅(qū)動(dòng)的數(shù)字人,甚至能做到24小時(shí)全天候不間斷直播,是前者根本“卷”不動(dòng)的高度。
如果說,“中之人”驅(qū)動(dòng)數(shù)字人是“低垂的果實(shí)”,那么在今天,過度依賴“中之人”帶來的問題和制約也越來越明顯。
即使暫時(shí)放下產(chǎn)能不足的問題,過于依賴“中之人”,而導(dǎo)致數(shù)字人“塌房”的事件也不在少數(shù)。
不僅日本幾位主播,因?yàn)?ldquo;中之人”發(fā)表辱華言論導(dǎo)致在國內(nèi)被封殺;今年字節(jié)旗下的頭部虛擬偶像團(tuán)體“A-Soul”,也因“中之人”和經(jīng)紀(jì)公司的糾紛,而造成了輿情危機(jī)。
先前的文章中,雷峰網(wǎng)也提到過,AI驅(qū)動(dòng)的數(shù)字人,勝在可復(fù)制、勝在全天候、勝在可控。
除了在視頻內(nèi)容平臺(tái),百度還推出了AI手語主播、AI數(shù)字記者、AI虛擬員工等數(shù)字人產(chǎn)品,在不少新領(lǐng)域拓展著AI數(shù)字人的可能性。
除了“中之人”,在素材生成的領(lǐng)域,數(shù)字人人也面臨著成本過高的難題。先前,雷峰網(wǎng)就了解到超寫實(shí)數(shù)字人渲染成本極高的情況——以在抖音上爆紅的柳夜熙為例,一秒的渲染成本就在8千到1.5萬不等。
然而,數(shù)字人要走向更廣闊的市場,精良寫實(shí)的畫面是必然的要求。數(shù)字人想“出圈”,降本增效也是必然。
02、AIGC,是數(shù)字人最強(qiáng)的“內(nèi)功”
而說起來簡單,支持服務(wù)型數(shù)字人,需要深厚強(qiáng)大的AI底蘊(yùn)支持。也就不得不再次提到AIGC的概念。
前面也提到,要砍掉對(duì)“中之人”的依賴,就需要以AI來驅(qū)動(dòng)數(shù)字人的行為舉止。如果要進(jìn)一步提升產(chǎn)能,還得能夠快速生產(chǎn)數(shù)字資產(chǎn),來提升豐富度,同時(shí)“降本增效”。
鋪開來講,要高效地支持AI數(shù)字人的生成與運(yùn)行,渲染、動(dòng)補(bǔ)、物理仿真等技術(shù)缺一不可;驅(qū)動(dòng)數(shù)字人的AI內(nèi)核,也要能夠自主完成AIGC內(nèi)容的生產(chǎn)。
擁有深厚的AI基礎(chǔ),百度在AI數(shù)字人的道路上,也走在賽道的前列。
根據(jù)中國信通院和其他機(jī)構(gòu)聯(lián)合發(fā)布的《數(shù)字人系統(tǒng)基礎(chǔ)能力評(píng)測》,百度智能云一路過關(guān)斬將,通過了48項(xiàng)測試,首批即獲得了權(quán)威認(rèn)證。
而在《互聯(lián)網(wǎng)周刊》發(fā)布的《 2021 虛擬數(shù)字人企業(yè)排名 TOP50 》榜單中,百度憑借央視虛擬主播、冬奧手語數(shù)字人主播,排名中國數(shù)字人產(chǎn)業(yè)綜合實(shí)力第一位。
在耀眼的成績之下,百度智能云推出的曦靈數(shù)字平臺(tái),則是他們最強(qiáng)有力的武器。
以云原生渲染技術(shù)、超高清風(fēng)格化人像、單目攝像頭動(dòng)作捕捉等核心技術(shù),“曦靈”能夠勝任大規(guī)模、超寫實(shí)的數(shù)字人生產(chǎn),也能實(shí)現(xiàn)更簡單易用的數(shù)字人驅(qū)動(dòng)。
而在數(shù)字人直播平臺(tái)2.0的技術(shù)賦能下,百度的AI數(shù)字人能夠自動(dòng)編排模塊+問答系統(tǒng),實(shí)現(xiàn)“無人值守”的全自動(dòng)直播。
在由“中之人”驅(qū)動(dòng)的時(shí)候,曦靈還提供了自研的智能綁定控制系統(tǒng)“Smart Rig”,讓動(dòng)作和面部表情捕捉更加精準(zhǔn),實(shí)時(shí)捕捉,也能針對(duì)“中之人”進(jìn)行快速優(yōu)化。
同時(shí),憑借著口型合成算法“Smile Talk”和4D掃描的機(jī)器學(xué)習(xí)方案,只需輸入文字,AI數(shù)字人就能實(shí)現(xiàn)跨模態(tài)的面部表情合成,不僅口型生成準(zhǔn)確率超過98.5%,口型還能和數(shù)字人的面部表情相結(jié)合,觀感更加親切自然。
同時(shí),在物理仿真技術(shù)的支持下,AI數(shù)字人可以“試穿”服飾,讓觀眾即使在虛擬直播間,能夠直觀地看到服裝上身的效果,也帶給了虛擬主播帶貨大量新的可能性。
背后有強(qiáng)大AI實(shí)力加持,百度推出了不少成功的數(shù)字人產(chǎn)品:虛擬偶像希加加能歌善舞、AI助手度曉曉博聞強(qiáng)識(shí)、央視新聞AI手語主播動(dòng)作精準(zhǔn)迅速……
03、結(jié)語
歲寒,然后知松柏之后凋也。
Meta裁員一周后,亞馬遜也宣布裁員,規(guī)模也在萬人左右。聽聞這個(gè)消息,科技圈又難免唏噓,”寒氣“是真的,而且不只是中國,是“全球變冷”。
元宇宙不怕寒氣——或者說,創(chuàng)新者對(duì)元宇宙的探索,本就是在寒夜中獨(dú)行,對(duì)區(qū)區(qū)“寒氣”早已見怪不怪,心中有火,就不畏寒冷。
據(jù)《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》預(yù)計(jì),2030年我國虛擬數(shù)字人市場規(guī)模將達(dá)到2700億元,未來市場樂觀向好,競爭也會(huì)越發(fā)激烈。
機(jī)遇有,挑戰(zhàn)也在。
在未來數(shù)字人賽道的競逐中,技術(shù)仍然是第一性。在數(shù)字人領(lǐng)域,百度用AI技術(shù)建立起了一道厚實(shí)的“城墻”,把市場的寒冷抵御在外。
在不確定的市場中,以技術(shù)謀得確定性。百度為數(shù)字人規(guī)劃的未來,還有很長。