關(guān)于機(jī)器人現(xiàn)在和未來(lái)的實(shí)戰(zhàn)和推演,真正的智能何時(shí)到來(lái)?
機(jī)器人無(wú)疑是大賽道,不過(guò)2022年的機(jī)器人賽道,個(gè)中滋味可能只有從業(yè)者最清楚。
經(jīng)歷了兩年多的狂歡,掃地機(jī)器人逐漸告別高增長(zhǎng),根據(jù)IDC預(yù)測(cè),2022年市場(chǎng)出貨量同比下降23.8%,市場(chǎng)壓力陡增。相形之下,人形機(jī)器人在2022年頗受矚目,戴森、特斯拉、小米……大佬趕集式布局,不過(guò),重磅亮相之后,兩極化的市場(chǎng)反響、對(duì)商業(yè)前景的質(zhì)疑,不絕于耳。
如果說(shuō)掃地機(jī)器人代表現(xiàn)在,人形機(jī)器人代表未來(lái),機(jī)器人真正進(jìn)入、并良好融入我們的生活,會(huì)比想象中更快還是更慢?從現(xiàn)在到未來(lái),還有哪些難題待解?
“誰(shuí)來(lái)保護(hù)我的隱私?”
“亂撞”、“不智能”、“掃不干凈”……這些槽點(diǎn)后,掃地機(jī)器人最近又?jǐn)偵狭艘粋€(gè)新“罪名”:泄露隱私數(shù)據(jù)。事情起源于《麻省理工科技評(píng)論》的一篇長(zhǎng)文調(diào)查,曝光了國(guó)外某品牌的掃地機(jī)器人自帶攝像頭拍攝用戶的事件,包括用戶在家上廁所的動(dòng)態(tài),甚至人臉信息都清晰可見,都被拿去給AI模型做訓(xùn)練數(shù)據(jù)。這讓用戶對(duì)家中的智能設(shè)備再次產(chǎn)生了擔(dān)憂:誰(shuí)來(lái)保護(hù)我的隱私?
越來(lái)越多的掃地機(jī)器人轉(zhuǎn)向計(jì)算機(jī)視覺(jué),而為了讓視覺(jué)導(dǎo)航實(shí)現(xiàn)更好的效果,就需要在更多高質(zhì)量、多樣化的數(shù)據(jù)集上對(duì)AI模型進(jìn)行訓(xùn)練。在上述調(diào)查所提到的案例中,一些具體的物體、場(chǎng)景畫面都被加上了標(biāo)注,用以進(jìn)行訓(xùn)練。這些隱私信息理論上應(yīng)該處于非常嚴(yán)格的存儲(chǔ)和訪問(wèn)控制之下,雖然公司本身沒(méi)有泄露數(shù)據(jù),卻在交給第三方進(jìn)行數(shù)據(jù)標(biāo)注的環(huán)節(jié)出現(xiàn)了紕漏,被負(fù)責(zé)標(biāo)注的員工分享到了網(wǎng)上。
攝像頭讓掃地機(jī)器人不那么智障的同時(shí),卻帶來(lái)視覺(jué)數(shù)據(jù)特別是隱私數(shù)據(jù)被泄露的風(fēng)險(xiǎn),這讓AI應(yīng)用再次觸及到了“數(shù)據(jù)隱私”這個(gè)紅線。
汪清在掃地機(jī)器人領(lǐng)域從事研發(fā)工作,他告訴<與非網(wǎng)>,技術(shù)易實(shí)現(xiàn),但法律合規(guī)卻是一個(gè)繞不開的難題。如何防止隱私被偷窺?如何規(guī)避法律風(fēng)險(xiǎn)?成為產(chǎn)品落地時(shí)必須面對(duì)的問(wèn)題。
當(dāng)前,中高端掃地機(jī)器人基本都配置了AI攝像頭,用于輔助識(shí)別物體并執(zhí)行特定的清掃策略。然而,受到成本和算力的限制,AI掃地機(jī)器人只能滿足輔助清掃的基本需求,因此,提升識(shí)別準(zhǔn)確度、降低誤識(shí)別概率,就成了產(chǎn)品的主要賣點(diǎn)之一。
那么,如何提高識(shí)別準(zhǔn)確度?很重要的一環(huán)就是投喂量足夠大、足夠好的數(shù)據(jù),來(lái)進(jìn)行數(shù)據(jù)訓(xùn)練。對(duì)于商業(yè)公司來(lái)說(shuō),獲得數(shù)據(jù)來(lái)源最簡(jiǎn)單直接的方式就是將用戶數(shù)據(jù)上傳到云端采集,經(jīng)過(guò)訓(xùn)練優(yōu)化模型后,再以固件更新的形式發(fā)布。
汪清指出,這其中可能就包括了隱私被偷窺的風(fēng)險(xiǎn),也成為了產(chǎn)品進(jìn)一步升級(jí)時(shí)必須面對(duì)的問(wèn)題。一方面,消費(fèi)者要盡量選擇有保障的品牌產(chǎn)品,并且在使用過(guò)程中注重?cái)?shù)字密碼安全等問(wèn)題;另一方面,也需要廠商提升設(shè)備安全性能、加強(qiáng)云端數(shù)據(jù)安全。但最重要的,是相關(guān)法律法規(guī)的不斷完善,在此基礎(chǔ)上的技術(shù)創(chuàng)新才能推動(dòng)更為安全的數(shù)據(jù)生態(tài)。
機(jī)器智能:終極AI的最后一公里
人形機(jī)器人可以說(shuō)是最符合人類理想的機(jī)器人形態(tài),也始終在吸引著更大的市場(chǎng)興趣。馬斯克甚至認(rèn)為,“當(dāng)有一天我們解決了汽車的自動(dòng)駕駛問(wèn)題(即現(xiàn)實(shí)世界的 AI 問(wèn)題)后,就可以將 AI 技術(shù)推廣到人形機(jī)器人身上。這將比汽車具有更廣闊的應(yīng)用前景?!睂?duì)于特斯拉機(jī)器人的定位,他表示,最初是替代人們從事重復(fù)枯燥、具有危險(xiǎn)性的工作,但遠(yuǎn)景目標(biāo)是讓其服務(wù)于千家萬(wàn)戶,比如做飯、修剪草坪、照顧老人等。
要真正讓機(jī)器人走進(jìn)現(xiàn)實(shí)生活中,還有無(wú)數(shù)個(gè)難題要攻克。除了技術(shù)、機(jī)械挑戰(zhàn),一個(gè)最為核心的問(wèn)題還是人形機(jī)器人的“大腦”。市場(chǎng)上有研究者“拆解”了機(jī)器人的機(jī)械構(gòu)造,發(fā)現(xiàn)雖然零部件是成本占比最高的部分,但“大腦”需要AI技術(shù)助推,是“把機(jī)器轉(zhuǎn)化為機(jī)器人”的關(guān)鍵。
從AI大廠離開的李卓,正全身心沉浸在包括認(rèn)知科學(xué)等在內(nèi)的心理學(xué)研究中,他告訴<與非網(wǎng)>,現(xiàn)階段的人工智能,仍以模仿人類為主,不論是計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理還是生成式AI(包括AIGC、數(shù)字人等),其內(nèi)核還是算力、算法和數(shù)據(jù)的有效結(jié)合和應(yīng)用。
放眼未來(lái)的人工智能,應(yīng)該是有感知、有認(rèn)知、會(huì)學(xué)習(xí)、自成長(zhǎng)的機(jī)器智能。那么,如何才能實(shí)現(xiàn)這種更高階的、或者說(shuō)理想中的智能形態(tài)?
李卓指出,首先,人類屬于碳基智能體,是一種具身智能;而機(jī)器智能屬于硅基智能體,是一種人工智能,其生成來(lái)自于人類的大規(guī)模芯片制造,進(jìn)化則來(lái)自大數(shù)據(jù)喂養(yǎng)下算法的快速迭代。
對(duì)于機(jī)器智能體來(lái)說(shuō),先天的不足——是其芯片組件往往來(lái)自人類的預(yù)先設(shè)計(jì),一旦制成,在整個(gè)生命周期中無(wú)法動(dòng)態(tài)修改,無(wú)法在環(huán)境的交互中動(dòng)態(tài)優(yōu)化。不過(guò),隨著芯片設(shè)計(jì)、封裝、制造等技術(shù)的演進(jìn),包括chiplet、量子芯片等發(fā)展,機(jī)器智能體的計(jì)算方式也在發(fā)生變化,迭代進(jìn)化速度將不斷加快。
其次,人類的活動(dòng)空間是寬泛的,既可以是物理空間,也可以是數(shù)字空間;而AI的活動(dòng)空間是數(shù)字空間,要想對(duì)周圍的物質(zhì)或能量產(chǎn)生效果,需要通過(guò)傳感器的采集和執(zhí)行器的操作才能實(shí)現(xiàn)。更為重要的是,人可以通過(guò)移動(dòng)從多個(gè)視角去感知所處空間,而機(jī)器人暫時(shí)還不具備這種能力,往往只能處在某一個(gè)場(chǎng)景簡(jiǎn)單的專業(yè)環(huán)境中,缺乏人類在通用環(huán)境中廣泛的活動(dòng)和社交能力,這是其局限之處。
第三,AI往往參考馮諾依曼架構(gòu)進(jìn)行計(jì)算,局限在數(shù)字空間,在解決特定問(wèn)題時(shí)更高效,有一種“大數(shù)據(jù),小任務(wù)”的感覺(jué)。
而人類的思考方式往往是感知-認(rèn)知-運(yùn)動(dòng)類學(xué)習(xí),大腦通過(guò)觀察感覺(jué)輸入如何隨著運(yùn)動(dòng)而變化,去學(xué)習(xí)世界模型再去反應(yīng)。其思維的過(guò)程就是數(shù)百億神經(jīng)元的活動(dòng),每個(gè)神經(jīng)元都有數(shù)以千計(jì)的突出,與成千上萬(wàn)個(gè)其他神經(jīng)元相連,人類所知的一切都存儲(chǔ)在這些神經(jīng)元的聯(lián)接中。人類的思考往往具有一種“小數(shù)據(jù),大任務(wù)”的感覺(jué),通過(guò)分層分級(jí),上一層的價(jià)值決定這一層的策略,比如基于一個(gè)人的價(jià)值觀,就能大致判斷出他的行動(dòng)策略。
在可預(yù)見的未來(lái),兩種智能將走向融合,在物質(zhì)的聯(lián)網(wǎng)(交通網(wǎng))、能量的聯(lián)網(wǎng)(能源網(wǎng)),信息的聯(lián)網(wǎng)(物聯(lián)網(wǎng)&互聯(lián)網(wǎng))基礎(chǔ)之上,將會(huì)形成智能的聯(lián)網(wǎng)——也就是是人類智能體和機(jī)器智能體的融合,并且這種融合將會(huì)逐步疊加、互相滲透,例如大腦、器官、義肢、神經(jīng)元等,將形成更深層的融合。
“所謂的元宇宙,其實(shí)就是人類智能體和機(jī)器智能體共生的環(huán)境”,李卓表示,“在這個(gè)混合時(shí)空中,機(jī)器智能體從數(shù)字空間拓展到物理空間,伴生著人類進(jìn)一步拓展更多個(gè)性化的時(shí)空,未來(lái),如何構(gòu)建共同的混合智能倫理和社會(huì)將成為我們面臨的挑戰(zhàn)。”
伴隨著AI的發(fā)展,其實(shí)人類對(duì)機(jī)器人的感情——可謂是又慕又怕,人類既享受作為“造物者”的智力探索,又懼怕制造出有自主意識(shí)、不受人類控制,甚至反攻人類的恐怖對(duì)手。
就比如人形機(jī)器人,這種具有自主特點(diǎn)的機(jī)器智能體,一旦大規(guī)模進(jìn)入社會(huì)生活領(lǐng)域后,將會(huì)很快進(jìn)步、積累出世界模型的通用知識(shí)和底層邏輯,發(fā)展速度會(huì)非???。那最終會(huì)不會(huì)出現(xiàn)電影《終結(jié)者》中的局面?馬斯克的答案是不會(huì),因?yàn)橐呀?jīng)在設(shè)計(jì)過(guò)程中考慮到了這些因素,設(shè)計(jì)了很多安全保障,本地有停止按鈕,可以終止它的行為,也可以通過(guò)遠(yuǎn)程控制進(jìn)行干預(yù)。
未來(lái),最終的智能形態(tài)將會(huì)主要受環(huán)境所驅(qū)動(dòng),就像大自然的平衡、生物多樣性一樣,人類智能和機(jī)器智能會(huì)共存。李卓補(bǔ)充說(shuō),比如在人類的活動(dòng)空間中,還是人類智能主導(dǎo)和控制的智能形態(tài);但是,假設(shè)拓展到星際智能、深海智能、地心智能……這些超出人類現(xiàn)存空間的領(lǐng)域,就更需要機(jī)器智能。
“更智能的代價(jià)”
知乎上有一個(gè)有趣的帖子,是關(guān)于那場(chǎng)著名的對(duì)弈——“AlphaGo 和人類棋手比起來(lái)誰(shuí)消耗的資源更多”。其中的一些討論,也適用于對(duì)機(jī)器人落地的思考。
在這場(chǎng)比賽中,一邊是1202個(gè)CPU、176個(gè)GPU和100多名科學(xué)家在背后,另一邊是一個(gè)人腦和一杯咖啡。這難道說(shuō)明人腦效率遠(yuǎn)高于電腦、AI是靠著幾百上千倍的能源消耗才取勝嗎?
不全是。
時(shí)隔一年后,AlphaGo從內(nèi)到外又都煥然一新。內(nèi)部軟件算法升級(jí),不再拘泥于人類棋譜而是自我對(duì)弈,比原先的暴力檢索大大改觀,幾秒鐘就能下一手棋;外部硬件核心全盤更換為Google新研制的TPU,這種專為AI而生的芯片在特定場(chǎng)合比CPU和GPU的性能有了極大提升,以至于與柯潔對(duì)弈的AlphaGo版本只需靠一臺(tái)物理機(jī)上的4個(gè)TPU即可運(yùn)行,而單枚TPU的設(shè)計(jì)功耗僅為40W。
僅僅一年,AlphaGo的實(shí)力又升了幾個(gè)臺(tái)階,而功耗卻縮減到千分之一,和人類幾乎處于同一數(shù)量級(jí)。再過(guò)一年、五年、十年,將會(huì)怎樣?
這些都是人類在通往更智能的路上所需要付出的代價(jià),比如:你愿意承擔(dān)多少能源消耗、投入多少人才、付出多大成本、給予多長(zhǎng)的時(shí)間周期……但最后都要回到一個(gè)終極問(wèn)題上:場(chǎng)景在哪里?
就像把機(jī)器人比作一個(gè)要踏入職場(chǎng)的應(yīng)屆生,你能給它找到一份什么樣的工作?這是值得去更多思考的。
寫在最后
機(jī)器人賽道難,難在哪里?難在頂不了天,落不了地。
像掃地機(jī)器人這樣的新興賽道,高速發(fā)展期過(guò)后,成本、受眾、創(chuàng)新等問(wèn)題都逐漸暴露眼前,都是對(duì)下一步拓展市場(chǎng)的挑戰(zhàn)。而人形機(jī)器人這樣的未來(lái)項(xiàng)目,自身的打磨仍需要足夠長(zhǎng)的時(shí)間周期,更需要找到適合大規(guī)模落地的實(shí)際場(chǎng)景。
工信部數(shù)據(jù)顯示,過(guò)去兩年我國(guó)機(jī)器人行業(yè)仍處于虧損經(jīng)營(yíng)階段。尤其是2020年,規(guī)模以上機(jī)器人企業(yè)凈利潤(rùn)同比下降26.9%,行業(yè)利潤(rùn)率僅3.33%。就連滲透率、普及率較高的清潔機(jī)器人、工業(yè)機(jī)器人賽道,尚且沒(méi)有完全擺脫虧損。
在交流中,汪清告訴<與非網(wǎng)>,機(jī)器人乃至AI落地的最大挑戰(zhàn),主要還是應(yīng)用的客戶和需求尚未明確。AI落地的第一波推動(dòng)力量是學(xué)術(shù)界的力量、應(yīng)用場(chǎng)景的突破以及資本的加持,再加上熱點(diǎn)事件的助力,打響了產(chǎn)業(yè)落地第一戰(zhàn),也形成了廣泛共識(shí)——技術(shù)成熟、可商業(yè)化,只要找到用戶就可以形成標(biāo)志示范效應(yīng)廣泛推廣。
但是,這個(gè)階段的AI公司沒(méi)有盈利業(yè)務(wù)支撐研發(fā),只能通過(guò)不斷嘗試不同行業(yè)場(chǎng)景下的落地實(shí)踐,提供完整的交付并反饋才能完成落地閉環(huán)。人力成本、經(jīng)營(yíng)成本高昂,試錯(cuò)成本過(guò)高,也不得不依賴多次融資,反復(fù)打通場(chǎng)景更換項(xiàng)目來(lái)維持活躍性,這是AI初創(chuàng)企業(yè)在新場(chǎng)景落地面臨的困難之一。
這不僅是人力成本和經(jīng)營(yíng)成本無(wú)法匹配項(xiàng)目營(yíng)收的困難,也是項(xiàng)目定制化帶來(lái)的成本高昂的泡沫。對(duì)于初創(chuàng)AI公司來(lái)說(shuō),獲客成本高,對(duì)傳統(tǒng)企業(yè)轉(zhuǎn)型AI來(lái)說(shuō),更多是對(duì)現(xiàn)有客戶的增值,特別是在服務(wù)碎片化市場(chǎng)客戶的時(shí)候,比如細(xì)分的機(jī)器人賽道,這樣的基礎(chǔ)差別就會(huì)更大。