為創(chuàng)造一個(gè)不受外界幫助的軟體機(jī)器人,MIT CSAIL 將目光聚焦于深度學(xué)習(xí)。
說(shuō)起軟體機(jī)器人,或許很多人都不覺(jué)得陌生了。
軟體機(jī)器人的發(fā)展離不開(kāi)包括材料學(xué)、機(jī)器人學(xué)、生物力學(xué)、傳感與控制在內(nèi)的多學(xué)科進(jìn)步,近年來(lái)相關(guān)學(xué)科迅速發(fā)展,各類軟體機(jī)器人也開(kāi)始涌現(xiàn)。
機(jī)器人與自動(dòng)化國(guó)際會(huì)議 ICRA 2017 的會(huì)場(chǎng)上,曾參與發(fā)明達(dá)芬奇手術(shù)機(jī)器人的香港中文大學(xué)機(jī)械與自動(dòng)化工程學(xué)系副教授 Samuel Au 這樣向雷鋒網(wǎng)表示:
軟體機(jī)器人在醫(yī)療領(lǐng)域的應(yīng)用十分廣泛,甚至?xí)D(zhuǎn)變醫(yī)療機(jī)器人的范式。軟體機(jī)器人是手術(shù)機(jī)器人的終極目標(biāo)。
當(dāng)然,除了醫(yī)療領(lǐng)域,軟體機(jī)器人還有一個(gè)廣闊的市場(chǎng)——玩具。
這個(gè)市場(chǎng)中,迪士尼對(duì)軟體機(jī)器人頗為關(guān)注。就在去年,迪士尼研究院(Disney Research)曾基于算法和一種特殊的拉伸傳感器,讓軟體機(jī)器人有了「本體感知」的能力。
最近,在世界領(lǐng)先的機(jī)器人專家之一 Daniela Rus 教授的領(lǐng)導(dǎo)下,MIT CSAIL 也做出了類似的成果:基于他們開(kāi)發(fā)的算法,軟體機(jī)器人體內(nèi)的傳感器得到了優(yōu)化,因此能更好地在環(huán)境中感受自身、與環(huán)境互動(dòng)。
相關(guān)論文題為 Co-Learning of Task and Sensor Placement for Soft Robotics(軟體機(jī)器人任務(wù)與傳感器布置的協(xié)同學(xué)習(xí)),將于 2021 年 4 月的 IEEE International Conference on Soft Robotics(IEEE 軟體機(jī)器人國(guó)際會(huì)議)上進(jìn)行展示。
1、讓軟體機(jī)器人回答出“我在哪”
很多人的印象中,機(jī)器人都有著堅(jiān)硬的外殼,充滿金屬感,這便是傳統(tǒng)的剛性機(jī)器人。通常,剛性機(jī)器人關(guān)節(jié)、肢體的有限陣列通過(guò)控制映射和運(yùn)動(dòng)規(guī)劃的算法使得計(jì)算易于掌控。
不同于剛性機(jī)器人,軟體機(jī)器人不論結(jié)構(gòu)還是材料都是非線性的,且擁有多自由度,因此其動(dòng)作任務(wù)更加復(fù)雜,因此對(duì)算法的要求非常高。
正如論文介紹的那樣:
軟體機(jī)器人必須在一個(gè)無(wú)限維的狀態(tài)空間中進(jìn)行推理,而映射這個(gè)連續(xù)狀態(tài)空間并不簡(jiǎn)單(特別是在基于有限的離散傳感器集工作的情況下,畢竟傳感器位置對(duì)機(jī)器人任務(wù)學(xué)習(xí)模型的豐富性有著深遠(yuǎn)影響)。
上面這段話通俗來(lái)講就是,軟體機(jī)器人要想可靠地完成程序設(shè)定的任務(wù),它們需要知道自己所有身體部位所在的位置,而由于軟體機(jī)器人幾乎可以以無(wú)限種方式變形,因此這項(xiàng)任務(wù)相當(dāng)艱巨。
為了讓軟體機(jī)器人回答出“我在哪”的問(wèn)題,此前科學(xué)家們的策略是:用一個(gè)外部攝像頭來(lái)繪制機(jī)器人的位置,并將信息反饋到機(jī)器人的控制程序中。
但 MIT CSAIL 的想法是:創(chuàng)造一個(gè)不受外界幫助的軟體機(jī)器人。
在研究團(tuán)隊(duì)看來(lái):
不能在機(jī)器人身上安裝無(wú)數(shù)個(gè)傳感器,真正的問(wèn)題是:要有多少傳感器、要把傳感器放在哪,才有最大的性價(jià)比?
正因如此,MIT CSAIL 將目光聚焦于深度學(xué)習(xí)。
他們開(kāi)發(fā)了一種算法,能夠幫助工程師設(shè)計(jì)出收集更多與周圍環(huán)境相關(guān)的有用信息的軟體機(jī)器人。
具體而言,這種新的協(xié)同學(xué)習(xí)傳感器放置和復(fù)雜任務(wù)的表示方法,可以處理機(jī)載傳感器信息,從而學(xué)習(xí)突出和稀疏的位置選擇,優(yōu)化傳感器在機(jī)器人體內(nèi)的位置,保證機(jī)器人獲得最優(yōu)的任務(wù)性能。
論文合著者之一 Alexander Amini 表示:
這一系統(tǒng)不僅可以學(xué)習(xí)給定的任務(wù),而且還能學(xué)習(xí)如何以最佳方式設(shè)計(jì)機(jī)器人來(lái)解決任務(wù)。傳感器的放置是一個(gè)非常難解決的問(wèn)題,所以這個(gè)解決方案是非常令人興奮的。
論文顯示,由于許多軟體機(jī)器人在本質(zhì)上是呈節(jié)點(diǎn)的,因此新架構(gòu)采用了基于點(diǎn)-云(point-cloud-based)的學(xué)習(xí)和概率稀疏化。他們的方法將傳感器設(shè)計(jì)視為學(xué)習(xí)的雙重過(guò)程,在單一的端到端培訓(xùn)過(guò)程中結(jié)合了物理和數(shù)字設(shè)計(jì)。
在論文中,研究人員將這種架構(gòu)稱為 PSFE 網(wǎng)絡(luò)(即 point sparsification and feature extraction network,點(diǎn)稀疏化和特征提取網(wǎng)絡(luò))。
PSFE 網(wǎng)絡(luò)能夠同時(shí)學(xué)習(xí)傳感器的讀數(shù)表示和傳感器的位置。如下圖所示,PSFE 網(wǎng)絡(luò)是研究團(tuán)隊(duì)做的所有演示和應(yīng)用的核心——演示包括對(duì)象抓取預(yù)測(cè)(B)、學(xué)習(xí)本體感受(C)和控制(D)。
事實(shí)證明,在放置傳感器方面,算法的表現(xiàn)大大超過(guò)了人類直覺(jué)!
總結(jié)來(lái)看,這項(xiàng)成果的主要貢獻(xiàn)在于:
對(duì)應(yīng)變和應(yīng)變速率的測(cè)量:用于推理軟體機(jī)器人狀態(tài)的神經(jīng)結(jié)構(gòu);
一種適用于下游任務(wù)的最小集稀疏化概率傳感器表示,以及一種超越了自動(dòng)化和人工基線的算法;
兩個(gè)任務(wù)(7 種軟性機(jī)器人形態(tài)的觸覺(jué)感知和本體感受)中任務(wù)學(xué)習(xí)和傳感器放置協(xié)同設(shè)計(jì)的演示。
論文合著者之一 Andrew Spielberg 表示:
我們的工作有助于實(shí)現(xiàn)機(jī)器人設(shè)計(jì)自動(dòng)化。除了開(kāi)發(fā)控制機(jī)器人運(yùn)動(dòng)的算法,我們還需要考慮如何對(duì)這些機(jī)器人進(jìn)行感知,以及如何與機(jī)器人的其他組件相互作用。未來(lái)如果在工業(yè)上加以應(yīng)用,影響可能是立竿見(jiàn)影的。
2、關(guān)于作者
該論文作者為包括 Andrew Spielberg 在內(nèi)的三位 MIT CSAIL 在讀博士生以及兩位 MIT 教授 Daniela Rus 和 Wojciech Matusik。
五位作者中,最有名氣的便是 Daniela Rus 教授。
【圖源 HyperAI 超神經(jīng) 】
Daniela Rus 是 MIT CSAIL 主任、Andrew and Erna Viterbi 電氣工程和計(jì)算機(jī)科學(xué)教授、IEEE Fellow、AAAI Fellow、美國(guó)國(guó)家工程院院士,曾于康奈爾大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。主要研究領(lǐng)域涵蓋機(jī)器人、移動(dòng)計(jì)算和數(shù)據(jù)科學(xué)。
前不久,福布斯 AI 專欄作家、創(chuàng)業(yè)投資公司 Highland Capital Partners 風(fēng)投專家 Rob Toews 曾撰文,列舉出了 8 位具有代表性的 AI 領(lǐng)域女性領(lǐng)袖,這 8 位女性領(lǐng)袖中包含李飛飛、NVIDIA 工程副總裁、Coursera 創(chuàng)始人,也有 Daniela Rus 的名字。
2016 年,雷鋒網(wǎng)編輯曾與 Daniela Rus 展開(kāi)了一場(chǎng)深入對(duì)談。
在被問(wèn)到“機(jī)器學(xué)習(xí)或深度學(xué)習(xí)最終是否能幫助我們制造出通用型人工智能(AGI)”時(shí),這位 AI 大牛談到,尚無(wú)法判斷深度學(xué)習(xí)最后到底能不能實(shí)現(xiàn) AGI。
在她看來(lái),深度學(xué)習(xí)可以說(shuō)是很有潛力,但也存在一些問(wèn)題:
- 深度學(xué)習(xí)需要大量數(shù)據(jù)去訓(xùn)練,也就意味著需要很深的理解,而通用型智能的學(xué)習(xí)方法應(yīng)該要更“通用”才對(duì)。深度學(xué)習(xí)還是會(huì)犯錯(cuò)。實(shí)際上我們還不太清楚深度學(xué)習(xí)的運(yùn)作原理,不太清楚為什么它表現(xiàn)得這么好。
也就是說(shuō),只有當(dāng)我們對(duì)深度學(xué)習(xí)甚至我們自己有更深的了解之后,才能回答這個(gè)問(wèn)題。
當(dāng)時(shí) Daniela Rus 也坦言,自己最感興趣的研究領(lǐng)域是機(jī)器人:
我我們正在研究如何制造更好的自動(dòng)化系統(tǒng),自動(dòng)化系統(tǒng)能深刻的改變這個(gè)世界。改變?nèi)藗兺瓿扇蝿?wù)的方式,并且可以讓我們更好的理解彼此。如果我們能造出一臺(tái)各種行為表現(xiàn)的都和生物很像的機(jī)器。那這臺(tái)機(jī)器的內(nèi)在原理可能跟生物的內(nèi)在原理比較相似,我們可能可以通過(guò)這種研究加深對(duì)我們自己的理解。
如今看來(lái),在 Daniela Rus 帶領(lǐng)下的 MIT CSAIL 朝著自動(dòng)化系統(tǒng)又邁進(jìn)了一步。
引用來(lái)源:
- https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9345345https://www.csail.mit.edu/person/daniela-rus