加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

技術(shù)轉(zhuǎn)型新思路 | AI方向教師資格證考培課程

2022/04/06
233
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

智能汽車機(jī)器人的第一形態(tài),對(duì)應(yīng)的智能座艙也引領(lǐng)了機(jī)器人時(shí)代人機(jī)交互發(fā)展的新方向。歷史上,每一次交互方式的改變,都重塑了智能設(shè)備的產(chǎn)業(yè)格局。正如DOS轉(zhuǎn)向Windows時(shí)代帶來的產(chǎn)業(yè)巨變一樣,人機(jī)自然交互打開了一道通向新產(chǎn)業(yè)的大門。

人機(jī)自然交互將改變我們對(duì)待智能汽車、泛機(jī)器人和人工智能的態(tài)度。人類最重要的發(fā)明是創(chuàng)造了語言體系,用于人與人的交互,帶來人類文明;今天,人機(jī)自然交互可能是下一個(gè)基石性發(fā)明,其與機(jī)器的自主決策強(qiáng)結(jié)合,將帶來機(jī)器文明,重塑人與機(jī)器的關(guān)系,對(duì)我們的社會(huì)工作方式及生活方式等方面將產(chǎn)生深遠(yuǎn)的影響。

關(guān)鍵結(jié)論
1.未來最重要的人機(jī)交互趨勢(shì)是機(jī)器從被動(dòng)響應(yīng)走向主動(dòng)交互,從人適應(yīng)機(jī)器到機(jī)器不斷地適應(yīng)人,終極目標(biāo)是讓機(jī)器擬人化,圖靈測(cè)試是衡量標(biāo)準(zhǔn)。

2.人機(jī)共駕階段,人機(jī)交互能力必須跟自動(dòng)駕駛能力相匹配,否則會(huì)帶來嚴(yán)重的安全問題。智能駕駛和智能座艙的跨域融合是發(fā)展方向。

3.未來,實(shí)體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+AR-HUD

4.語音、手勢(shì)和眼球跟蹤是自然交互的三板斧,傳感器、算力和算法是物質(zhì)基礎(chǔ)。

5.當(dāng)前的座艙以?shī)蕵酚驗(yàn)橹鲗?dǎo),但未來座艙內(nèi)娛樂域和安全域(人機(jī)交互和自動(dòng)駕駛)的定位會(huì)調(diào)過來,安全域會(huì)成為主控制域。

6.智能座艙人機(jī)交互是中國(guó)智能汽車公司品牌向上的重要突破口。

人與機(jī)器的交互方式發(fā)展趨勢(shì)是什么?
座艙的人機(jī)交互未來將走向何方?這個(gè)問題的答案,可能需要從智能設(shè)備的發(fā)展歷史中去尋找。

計(jì)算機(jī)行業(yè)是人機(jī)交互技術(shù)發(fā)展的起源。實(shí)際上,人機(jī)交互一開始不叫HMI,而是HCI,即Human–Computer Interaction。PC的發(fā)展史廣為人知,下圖是一個(gè)簡(jiǎn)單的發(fā)展階段劃分:

計(jì)算機(jī)人機(jī)交互發(fā)展歷程

最開始是DOS系統(tǒng)加上鍵盤,命令行界面的操作需要非常高的專業(yè)技能,只有少數(shù)專業(yè)人員才能使用。鼠標(biāo)與Windows操作系統(tǒng)的出現(xiàn)改變了一切,讓PC用戶呈爆炸性增長(zhǎng)。接下來,觸控成為更簡(jiǎn)單直接的操作方式,出現(xiàn)了Surface這樣的平板電腦。而微軟小娜則代表了最新的交互方式,我們可以用語音這種更加自然的方式與機(jī)器交互。

PC和手機(jī)的發(fā)展史折射出機(jī)器與人交互方式的發(fā)展脈絡(luò),那就是從復(fù)雜走向簡(jiǎn)單;從抽象操作走向自然交互。未來最重要的人機(jī)交互趨勢(shì)是機(jī)器從被動(dòng)響應(yīng)走向主動(dòng)交互。
順著這樣一個(gè)趨勢(shì)的延長(zhǎng)線去看,人機(jī)交互的終極目標(biāo),就是讓機(jī)器擬人化,可以說:人機(jī)交互的發(fā)展歷史,是從人適應(yīng)機(jī)器到機(jī)器不斷地適應(yīng)人的發(fā)展史。

智能座艙的發(fā)展也經(jīng)歷了類似的過程:

智能座艙的人機(jī)交互發(fā)展與計(jì)算機(jī)有頗多相似之處

多模交互是下一代人機(jī)交互方式的理想模型,什么是多模交互?簡(jiǎn)單說,就是利用手勢(shì)、眼球跟蹤、語音等方式來進(jìn)行交互。這里的模態(tài)類似于人的“感官”,多模態(tài)即是將多種感官進(jìn)行融合,對(duì)應(yīng)人視覺、聽覺、觸覺、嗅覺、味覺五種感官。

但多模交互的命名太過技術(shù)化,我更愿意將其稱之為:自然交互。

例如手勢(shì),可以說是原生的“鼠標(biāo)”,不同的手勢(shì)能夠表達(dá)豐富的語義。

典型的手勢(shì)語義以及對(duì)應(yīng)的實(shí)現(xiàn)方式

自然交互實(shí)現(xiàn)方式是什么?
智能汽車本質(zhì)上是載人機(jī)器人,機(jī)器人最重要的兩項(xiàng)能力是自主決策能力和人機(jī)交互能力,缺乏其中任何一項(xiàng),就無法有效地為人類服務(wù)。因此打造智能的人機(jī)交互能力是其必選項(xiàng)。

如何衡量人機(jī)交互的智能化程度呢?我的一個(gè)思考是使用圖靈測(cè)試,即機(jī)器能否在交互行為的表現(xiàn)上和人無法區(qū)分。

如何實(shí)現(xiàn)自然交互呢?傳感器、算力和算法缺一不可。下圖做了一個(gè)直觀的展示:

座艙內(nèi)會(huì)融合越來越多的傳感器,一方面會(huì)使座艙內(nèi)算力需求不斷飆升,座艙里的AI算力需求將上升到30 TOPS以上,甚至百TOPS級(jí)別的水平。另一方面也提供了更好的感知能力支撐。

座艙傳感器在數(shù)量和種類上都在迅速提升

AI計(jì)算能實(shí)現(xiàn)人臉、表情、手勢(shì)、語音等多信息的感知,從而實(shí)現(xiàn)更加智能的人機(jī)交互。座艙人機(jī)交互的計(jì)算必須依賴邊緣計(jì)算,而不是云計(jì)算來實(shí)現(xiàn)。因?yàn)槿c(diǎn):可靠性、實(shí)時(shí)性和隱私保護(hù)。

個(gè)人隱私保護(hù)可能是我們這一代人在AI時(shí)代面臨的最大挑戰(zhàn)之一,座艙內(nèi)的私密空間,隱私保護(hù)問題更加突出。今天的語音識(shí)別,絕大部分仍然是在云端進(jìn)行的,其中的聲紋等生物信息可以輕易暴露個(gè)人身份。通過在車端進(jìn)行邊緣AI計(jì)算,可以將視頻、語音等個(gè)人生物信息去除,轉(zhuǎn)化為語義信息,再上傳到云端,可以有效保護(hù)車內(nèi)個(gè)人數(shù)據(jù)隱私。

自動(dòng)駕駛時(shí)代,交互智能必須跟駕駛智能相匹配
在可以預(yù)見的未來,人機(jī)共駕都會(huì)是長(zhǎng)期存在的狀態(tài),座艙內(nèi)的人機(jī)交互是人了解自動(dòng)駕駛能力的第一界面。

當(dāng)前智能汽車技術(shù)存在進(jìn)化不均衡的挑戰(zhàn),人機(jī)交互能力落后于自動(dòng)駕駛能力的發(fā)展,導(dǎo)致自動(dòng)駕駛事故頻發(fā),影響了自動(dòng)駕駛的普及。

人機(jī)共駕的特點(diǎn)是人在駕駛回路中(Human In the Loop),因此,人機(jī)交互能力必須跟自動(dòng)駕駛能力相匹配,否則帶來嚴(yán)重的預(yù)期功能安全問題,幾乎所有的自動(dòng)駕駛致命事故都與此有關(guān)。即使不發(fā)生事故,對(duì)自動(dòng)駕駛狀態(tài)的不了解也會(huì)讓人產(chǎn)生嚴(yán)重的恐慌和焦慮。

例如,自動(dòng)駕駛系統(tǒng)在實(shí)際駕駛工況中,經(jīng)常出現(xiàn)“鬼剎車”的情況。如果人機(jī)交互界面能夠顯示自動(dòng)駕駛的感知結(jié)果,司機(jī)就可能會(huì)明白系統(tǒng)誤判是由于把路上的一個(gè)易拉罐識(shí)別成了一輛車導(dǎo)致的。

為什么特斯拉把越來越多的自動(dòng)駕駛感知結(jié)果展示出來,背后的出發(fā)點(diǎn)就是這一原因。隨著自動(dòng)駕駛的能力越來越強(qiáng),用戶將越來越關(guān)注自動(dòng)駕駛系統(tǒng)在虛擬3D環(huán)境中呈現(xiàn)的過程和狀態(tài)。

人機(jī)交互與自動(dòng)駕駛相輔相成,其具體作用如下圖所示:

?

人機(jī)交互與自動(dòng)駕駛相輔相成

例如,未來更為人性化的泊車應(yīng)該是人車共泊的,包括人對(duì)車的接管和車對(duì)人的接管,比如車遇到困難路況,可能會(huì)說我不太有把握,請(qǐng)求接管。再比如人遲遲停不進(jìn)去,AI算法推薦是否開啟自動(dòng)泊車。

這種艙泊一體的方案能提升智能座艙交互和泊車的整體體驗(yàn),還能大幅節(jié)省硬件成本:通過分時(shí)復(fù)用AI芯片的資源,可以同時(shí)滿足座艙感知與APA泊車感知的需求,從而為行業(yè)提供高性價(jià)比方案,也可讓智能化下探到更多中低端車型。在國(guó)內(nèi),地平線和映馳科技合作,正在推進(jìn)這一方案開發(fā)。

當(dāng)前,智能座艙的交互方式主要還是手機(jī)安卓生態(tài)的延伸,主要由實(shí)體屏幕來支撐。今天屏幕越變?cè)酱?,甚至達(dá)到60寸,這實(shí)際上是用低優(yōu)先級(jí)的功能占據(jù)了高優(yōu)先級(jí)功能的空間,還帶來額外的信息干擾,容易讓人分心,影響駕駛安全。

實(shí)體屏幕在未來依然會(huì)存在,但我有一個(gè)判斷,未來,實(shí)體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+AR-HUD,下面我們做進(jìn)一步分析。
第一個(gè)原因:面向自動(dòng)駕駛的人機(jī)交互屬于溫飽問題,是剛需,屬于安全域,有最高優(yōu)先級(jí);面向音樂、游戲和舒適性的人機(jī)交互是小康需求,屬于娛樂域,在實(shí)現(xiàn)了前一階段任務(wù)后才能有足夠的施展空間。

下圖對(duì)兩個(gè)域的功能做了簡(jiǎn)要的分析總結(jié)。

座艙內(nèi)娛樂域和安全域的任務(wù)劃分

因此,未來座艙內(nèi)娛樂域和安全域(人機(jī)交互和自動(dòng)駕駛)的定位會(huì)調(diào)過來,安全域會(huì)成為主控制域。

第二個(gè)原因:自然交互方式+AR-HUD的交互界面更加安全,例如通過語音和手勢(shì)交流,可以避免駕駛員視線偏移,從而提升駕駛安全。而座艙的大屏是無法做到這一點(diǎn)的,相比之下,AR-HUD可以做到在顯示自動(dòng)駕駛感知信息的同時(shí)避免了這個(gè)問題。

第三個(gè)原因:自然交互方式是隱形的、簡(jiǎn)約的、更加情感化的交互方式,不會(huì)過多地占用車內(nèi)寶貴的物理空間,但卻可以做到隨時(shí)陪伴在身邊,給予駕駛員及乘客更多的信任感、安全感。

綜合以上分析,未來智能駕駛和智能座艙的跨域融合是較為確定的發(fā)展方向,最終誕生的就是車載中央計(jì)算平臺(tái)。

當(dāng)前發(fā)展階段、前沿實(shí)踐以及挑戰(zhàn)
目前,座艙的語音識(shí)別基本已經(jīng)普及,語音識(shí)別主流廠商主要使用端到端算法,在理想實(shí)驗(yàn)環(huán)境下語音識(shí)別準(zhǔn)確率可高達(dá)98%以上。

DMS正在急速普及,預(yù)測(cè)至2030年裝備車內(nèi)攝像頭的車型占比將超過50%。

DMS普及勢(shì)頭迅猛

下一步將是語音+手勢(shì)+眼球跟蹤+AR-HUD交互界面的組合,這是對(duì)應(yīng)于L3+級(jí)別自動(dòng)駕駛的智能交互方式。業(yè)內(nèi)領(lǐng)先的車企已經(jīng)開始布局,如下圖所示。

人機(jī)自然交互成為車企的競(jìng)爭(zhēng)熱點(diǎn)

中國(guó)自主品牌在這一塊的實(shí)踐基本上跟國(guó)外領(lǐng)先品牌是并駕齊驅(qū)的,從迭代速度上看還要更快。2020年,長(zhǎng)安推出UNI-T車型, 包含多項(xiàng)主動(dòng)服務(wù)。比如:如果你正在接聽電話,系統(tǒng)會(huì)自動(dòng)降低多媒體音量;再比如,當(dāng)車機(jī)中控屏處于熄屏狀態(tài)時(shí),注視屏幕一秒即可喚醒屏幕。該方案搭載了地平線的征程2芯片,支持通過語音、動(dòng)作姿態(tài)、面部表情等指令的交互。

理想中的自然交互目標(biāo)是從用戶體驗(yàn)出發(fā),需要提供穩(wěn)定、流暢、可預(yù)期的交互體驗(yàn)。但理想再豐滿,也得從骨感的現(xiàn)實(shí)起步,當(dāng)前挑戰(zhàn)依舊眾多。

例如,當(dāng)前自然交互的誤識(shí)別情況依然嚴(yán)峻,全工況、全天候的可靠性和準(zhǔn)確率還不夠。比如手勢(shì)識(shí)別,也許你不經(jīng)意間動(dòng)一下手勢(shì),就會(huì)被誤識(shí)別為一個(gè)命令動(dòng)作,這只是無數(shù)種誤識(shí)別情況之一,在移動(dòng)狀態(tài)下,光照、震動(dòng)、遮擋等等都是巨大的工程挑戰(zhàn)。自然交互的流暢度也是亟待解決的問題,這需要更高性能的傳感器、更強(qiáng)大的算力和高效算法來逐漸改善。而同時(shí)自然語言理解(NLP)和意圖理解依然處于早期階段,還需要算法理論創(chuàng)新。

人機(jī)自然交互是機(jī)器人時(shí)代的基石性發(fā)明

總結(jié)
在當(dāng)下激烈的行業(yè)競(jìng)爭(zhēng)中,智能座艙已經(jīng)成為整車廠實(shí)現(xiàn)功能差異化的關(guān)鍵一招,座艙人機(jī)交互與人的溝通習(xí)慣、語言文化等密切相關(guān),因此必須是高度本地化的,智能座艙人機(jī)交互是中國(guó)智能汽車公司品牌向上的重要突破口,更是中國(guó)智能汽車技術(shù)引領(lǐng)全球技術(shù)潮流的突破口。

智能座艙產(chǎn)業(yè)鏈將持續(xù)延伸,會(huì)有更多玩家進(jìn)入到智能汽車這個(gè)大生態(tài)中,智能汽車玩家也會(huì)跨界進(jìn)入更多的機(jī)器人領(lǐng)域,未來智能座艙生態(tài)圈發(fā)展主題將圍繞“生態(tài)協(xié)同”與“跨界延伸”展開。這場(chǎng)科技革命將產(chǎn)生顛覆性影響,不僅將開啟一個(gè)全新的產(chǎn)業(yè)生態(tài),更對(duì)我們的社會(huì)工作方式及生活方式等方面產(chǎn)生深遠(yuǎn)的影響。

作者:李星宇簡(jiǎn)介

李星宇,地平線生態(tài)發(fā)展與戰(zhàn)略規(guī)劃副總裁,聚焦自動(dòng)駕駛、人工智能芯片以及邊緣計(jì)算等領(lǐng)域,負(fù)責(zé)地平線戰(zhàn)略規(guī)劃與生態(tài)建設(shè)工作。
李星宇先生是自動(dòng)駕駛與汽車芯片行業(yè)資深專家,擁有18年半導(dǎo)體行業(yè)經(jīng)驗(yàn)。加入地平線前,曾任恩智浦(飛思卡爾)應(yīng)用處理器汽車業(yè)務(wù)高級(jí)市場(chǎng)經(jīng)理,及士蘭微電子安全技術(shù)專家。
?

相關(guān)推薦

電子產(chǎn)業(yè)圖譜