如同手機“功能機”向“智能機”的升級,在人形機器人進入千家萬戶,真正改變我們生活的過程中,它們要為我們連接外界的信息、產(chǎn)品和服務(wù),就必須,也必然身在本地,腦在云端。
2023剛剛開年,人工智能與機器人就再一次點燃了各界對科技創(chuàng)新的關(guān)注和暢想。
無論《流浪地球2》電影里讓人后背發(fā)涼的人工智能MOSS,憨態(tài)可掬的智能機器狗“笨笨”;還是在各個創(chuàng)作和互動領(lǐng)域狂刷成就,被視為人工智能全新里程的ChatGPT,都在公眾、行業(yè)和資本等各個領(lǐng)域不斷引發(fā)連鎖反應(yīng)。
那么,在真實的世界里,人工智能和機器人的智能化水平達到什么程度了?二者相遇碰撞之后又將向如何進化?
【ChatGPT:人工智能的新時代起點】
從通過美國高校的入學資格考試(SAT),到編寫代碼、撰寫報告和構(gòu)思小說,ChatGPT的出現(xiàn)都讓公眾感到了前所未有的壓力,迅速破圈。
與此類似的還有早先興起過的AI繪圖作畫,這些AIGC(人工智能生產(chǎn)內(nèi)容)被看作是繼UGC(用戶生產(chǎn)內(nèi)容)之后新的創(chuàng)新模式。
它為我們帶來的,不僅是在幾秒鐘之內(nèi)根據(jù)需求迅速生成內(nèi)容的效率提升。更重要的是,在回答開放問題,生成文字、圖片、視頻等創(chuàng)造性內(nèi)容等傳統(tǒng)AI最受困擾的領(lǐng)域,它也展現(xiàn)出了驚人的表現(xiàn)。
這些現(xiàn)象背后,一個最根本的變化是:
依托大型語言模型的訓練,ChatGPT對人類意圖的理解,有了跨越式的質(zhì)變提升。
在此之前,人工智能發(fā)展的上一個關(guān)鍵里程碑事件,是2016年3月,“深度學習”的代表AlphaGo正式擊敗圍棋世界冠軍李世石。
此后6年來,人工智能的發(fā)展日新月異,但始終存在一個巨大障礙:
由于算法復(fù)雜度和數(shù)據(jù)規(guī)模的限制,當下幾乎所有的AI,都只能同時在少量的垂直應(yīng)用方向上,實現(xiàn)接近或超越人類的智能表現(xiàn);而無法在對話、創(chuàng)造、情感、認知等更加開放、復(fù)雜的領(lǐng)域,實現(xiàn)從“弱人工智能”向“強人工智能”的關(guān)鍵一躍。
而現(xiàn)在,以ChatGPT的火爆為標志,我們已經(jīng)看到一個新的臨界點到來。
“從某種意義上來講,AlphaGo 是人工智能領(lǐng)域的第1顆原子彈,而ChatGPT就是氫彈。”達闥機器人創(chuàng)始人、CEO黃曉慶認為,雖然ChatGPT還需要更多的優(yōu)化,但它已經(jīng)跨越了圖靈測試的邊界,在那些需要高創(chuàng)作性的領(lǐng)域,為人工智能的發(fā)展和應(yīng)用推開了一個新的時代。
相較于傳統(tǒng)的人工標注的模型訓練,通過堆疊數(shù)據(jù)集進行“自學習”訓練的大模型、多模態(tài)AI,正如2016年的深度學習一樣,成為新的行業(yè)主流。
而在這個過程中,我們也將全面進入一個“強人工智能”的時代。具有更強感知、交互和創(chuàng)造力的,能在更加開放環(huán)境下,同時完成更多不同任務(wù)的新一代人工智能,將從AIGC應(yīng)用、生成式AI到更多應(yīng)用場景,為整個人類社會帶來新的改變。
【機器人應(yīng)用升級:4個D和4個C】
在這些改變中,最值得期待的領(lǐng)域之一,是智能機器人。
尤其是服務(wù)機器人。
多年來,幾乎所有從事機器人產(chǎn)業(yè)的人,都夢想著做出可以走進千家萬戶,完全替代人類的服務(wù)機器人;但同時也都明白,這一夢想在現(xiàn)階段幾乎不可能達成。
與傳統(tǒng)的在封閉環(huán)境里完成固定任務(wù),更強調(diào)精確性和高效性的工業(yè)機器人不同,服務(wù)機器人的應(yīng)用場景,主要是跟人類打交道,所以它更需要像人一樣,在開放復(fù)雜環(huán)境下具備相當強的自適應(yīng)能力。
無論是人類還是別的生物體,有些自適應(yīng)能力是天然形成的。比如看到障礙會躲開,碰到障礙物會后退等。
這些看起來稀松平常的行為,要讓機器人能夠?qū)崿F(xiàn),卻并非易事:先要對外部環(huán)境進行動態(tài)的數(shù)據(jù)和信息采集,根據(jù)信息匯總進行準確判斷,計算出最佳的行動軌跡,再將操作指令分解傳遞到各部件執(zhí)行并收集反饋。
與此同時,還必須要保持平衡,能上樓下樓,繞開障礙物,不會被突然撲過來的人車寵物撞倒;需要與人交互,聽懂我們的提問和指令,并馬上高效地理解和執(zhí)行;需要通過機械手完成更復(fù)雜的工作,比如掃地做飯,搬高挪低,扶老攜幼……
機器人表現(xiàn)出的自適應(yīng)能力和人越接近,就意味著輔助甚至取代人類工作的可能性越大。
在此之前,從本田公司發(fā)布第一代ASIMO算起,具備人類雙足行走能力的智能機器人問世已有23年。
這23年,正是人類科技,尤其是數(shù)字化產(chǎn)業(yè)蓬勃發(fā)展的階段,也帶動了機器人技術(shù)和產(chǎn)業(yè)的不斷突破和創(chuàng)新。
在這個過程中:
有的機器人公司更注重技術(shù)的研究。比如波士頓動力,每隔一段時間,就會發(fā)布一些讓業(yè)界嘆為觀止的演示視頻。雖然因為采用液壓驅(qū)動技術(shù),結(jié)構(gòu)復(fù)雜、成本高、維護難,重量高,難以轉(zhuǎn)化為商業(yè)產(chǎn)品,但卻讓我們對人形機器人的未來發(fā)展,有了更大的信心。
有的更長于商業(yè)化探索。比如特斯拉,雖然去年發(fā)布的擎天柱在感知、運動、交互等方面的能力和體驗都還有待進一步完善,但只是一場發(fā)布會,已經(jīng)把公眾的期待牢牢拉滿。
有的更聚焦于“內(nèi)功”的修煉。比如達闥機器人,以打造機器人產(chǎn)業(yè)生態(tài)為目標,蟄伏7年,終于在智能柔性關(guān)節(jié)、云端大腦、機器人操作系統(tǒng)、機器人元宇宙等關(guān)鍵技術(shù)和關(guān)鍵元器件領(lǐng)域完成了全方位的戰(zhàn)略卡位。
但不論是怎樣的方向,伴隨著大模型、多模態(tài)“強人工智能”的發(fā)展,智能機器人的發(fā)展也即將獲得更有力的助推。
黃曉慶認為,在未來幾年,智能機器人就將在4個D和4個C領(lǐng)域,為我們的生活帶來巨大改變:
4個D(主要面向垂直行業(yè)):
Dull,重復(fù)性很高,無聊的工作。
Dangerous,巡夜、爬高等危險工作。
Dirty,讓人感覺臟的工作,比如掃地、清潔等等。
Demeaning,比較沒有尊嚴的工作。
4個C(主要面向家庭):
Conversation,與人交流。
Clean,做清潔。
Care,照顧老人,照顧小孩。
Cooking,做飯。
【從“功能機”到“智能機”:機器人呼喚RobotGPT】
在“強人工智能”時代,智能機器人將如何學習和進步,不斷刷新自己的能力與體驗上限?
在我看來,圍繞“智能”兩個字,完全可以從手機的發(fā)展歷程中,得到非常有意思的參考和借鑒。
最初的手機,被稱為“功能機”,所有功能都固化在手機里。在這個時代,手機的功能相對單一,只能打電話和發(fā)短信,以及使用鬧鐘、游戲等少量“內(nèi)置功能”。
而隨著“智能機時代”來臨,手機逐漸成為了我們肢體、意志和生活的延伸,除了打電話和發(fā)短信,手機可以聽音樂、玩游戲,看新聞,點外賣,上網(wǎng)課、買東西……
在這個過程中,最大的改變不僅在于手機本身軟件和硬件的升級,更在于手機的功能已經(jīng)不再固化在手機內(nèi)部,而是來自于云端。
于是手機的作用完成了從工具到樞紐的質(zhì)變:通過越來越發(fā)達的信息高速網(wǎng)絡(luò),智能手機將我們與數(shù)據(jù)、資金、物流連接在了一起,將個體與整個世界的各種產(chǎn)品和服務(wù)連接在了一起。
而現(xiàn)在,這也將會是智能機器人發(fā)展的大勢所趨。
許多人認為,機器人發(fā)展的終極目標,是要讓一個機器人獨立實現(xiàn)接近人的思考能力和運動能力;但遺憾的是,大模型的人工智能,對算力和數(shù)據(jù)都有巨大要求,以我們當下的技術(shù)能力,存在太多短期內(nèi)無法解決的技術(shù)難題。
谷歌2021年發(fā)布的超級語言模型Switch Transformer參數(shù)規(guī)模達到1.6萬億,阿里達摩院的多模態(tài)大模型M6參數(shù)更直接突破了10萬億。
如果要讓機器人直接加載“強人工智能”,那只會讓機器人的芯片瞬間過載死機——即使能勉強運行,也會對本來就艱難的功耗和續(xù)航帶來巨大負擔。
對單機芯片的算力來說,這是讓人絕望的量級差。
所以,更科學更有效的辦法是,建立一個完整、高速的“端-網(wǎng)-云”體系,用強大的云端大腦,高速可靠的神經(jīng)網(wǎng)絡(luò),來承擔海量的計算工作,以此讓機器人突破算力和功耗的瓶頸,為我們提供所需要的智能服務(wù)。
從這個意義上來說,大模型人工智能的發(fā)展,也將為云端智能機器人的發(fā)展,打造出一個具有決定性的強大引擎。
而以更長遠的發(fā)展來看,人形機器人也將取代手機,新的“個人管家”將成為個體與世界連接的新的樞紐。
如同手機“功能機”向“智能機”的升級,在人形機器人進入千家萬戶,真正改變我們生活的過程中,它們要為我們連接外界的信息、產(chǎn)品和服務(wù),就必須,也必然身在本地,腦在云端。
這將是機器人的RobotGPT,機器人的未來。
【云端機器人:中國已經(jīng)領(lǐng)先全球】
就目前而言,已經(jīng)落地的智能機器人,絕大多數(shù)都還是通過終端自身算力承擔計算工作,功能和應(yīng)用粗糙的“弱人工智能”。
所以我們看到,雖然各種機器人五花八門,看上去種類繁多、功能各異,甚至在公眾宣傳和資本市場上喧囂熱鬧,但最終的用戶體驗都還普遍停留在“玩具”或者“初級服務(wù)層面”,未來都將被逐漸淘汰。
在未來幾年,我們很快會看到“強人工智能”驅(qū)動的新一代云端機器人,為我們帶來能力和體驗的質(zhì)變。
尤其值得注意的是,隨著近期ChatGPT的火熱,“中國與美國人工智能存在多大差異”成了一個新的火爆話題。
在這個問題上,各界議論紛紛,還未有統(tǒng)一答案。
但我們可以肯定的是,在云端機器人領(lǐng)域,中國已經(jīng)處在領(lǐng)先位置。
早在2015年,達闥機器人就已經(jīng)率先提出了云端機器人概念,并在此后幾年時間里,從專利、標準、技術(shù)平臺、操作系統(tǒng)、關(guān)鍵元器件、生態(tài)平臺在內(nèi)的整個產(chǎn)業(yè)鏈條,完成了全方位的技術(shù)和產(chǎn)業(yè)布局,構(gòu)建出了完整云端機器人的技術(shù)體系和運營平臺。
更重要的是,達闥的戰(zhàn)略并不是一家企業(yè)自己的“單打獨斗”,而是以帶動產(chǎn)業(yè)鏈共同發(fā)展為理念,搭建起一個由運營商、應(yīng)用開發(fā)商、人工智能提供商和機器人本體制造商共同形成的云端機器人生態(tài),從而匯聚整個產(chǎn)業(yè)鏈力量,形成了共同繁榮的積極生態(tài)。
通過達闥構(gòu)建的機器人云端大腦操作系統(tǒng)“海?!?,以及機器人虛擬開發(fā)平臺“海元世界”,任何開發(fā)者都可以根據(jù)自己的需要,在虛擬平臺上快速、高效、低成本地開發(fā)、訓練和驗證機器人,并通過云端機器人的標準控制單元(RCU)接入云端大腦,在千行百業(yè)投入應(yīng)用。
這樣一個生態(tài),就像是智能手機背后的操作系統(tǒng)、應(yīng)用商店、以及云端的海量應(yīng)用服務(wù),將成為機器人產(chǎn)業(yè)鏈從“功能機”向“智能機”升級的根基沃土。
更重要的是,達闥的理念和戰(zhàn)略布局,也已經(jīng)得到了國家層面的支持以及國際產(chǎn)業(yè)界的認可。
2022年,達闥獲得科技部許可,建立中國第一家、也是目前唯一一個國家級的新一代人工智能云端機器人開放創(chuàng)新平臺。
2022世界機器人大會發(fā)布的《機器人十大前沿熱點領(lǐng)域(2022-2023)》,達闥海睿操作系統(tǒng)、達闥“云端大腦+本地機器人”核心技術(shù)入選“2022—2023年機器人十大前沿技術(shù)”。
這意味著,與很多科技領(lǐng)域,中國落后于國際競爭對手不同,在這個代表未來大勢的關(guān)鍵行業(yè),中國已經(jīng)占據(jù)了寶貴先機。