“保姆級”邊緣計算在細分領(lǐng)域應(yīng)用案例分享
上周,雷鋒網(wǎng) AI 掘金志邀請到了觸景無限副總裁趙寒偉做客雷鋒網(wǎng)公開課,以“「邊緣計算」在地鐵等城市級場景下的實戰(zhàn)復(fù)盤”為題進行了干貨分享。后續(xù)將有更多課程上線,添加微信號 suekee777 報名聽課。近幾年,邊緣計算市場規(guī)模持續(xù)增長,并迅速在安防、智慧城市、自動駕駛等領(lǐng)域被應(yīng)用,邊緣端的處理、分析和存儲能力成為考驗 AI 公司的關(guān)鍵。
趙寒偉認為,物聯(lián)網(wǎng)和云發(fā)展多年,平臺建設(shè)和打通完成度已經(jīng)非常高,但智慧城市遲遲沒有真正到來,是因為基礎(chǔ)的感知沒有實現(xiàn),智慧城市細分領(lǐng)域多,感知涉及每個層面,而芯片算力和邊緣計算決定了感知能力,也唯有在前端智能分析,與后端配合,才能將城市物聯(lián)網(wǎng)數(shù)據(jù)完整利用,打造感知城市。觸景無限一直專注于利用人工智能技術(shù),在邊緣端進行計算實現(xiàn)邊緣智能感知的領(lǐng)域,十年時間在各個細分領(lǐng)域積累了大量實際案例,趙寒偉結(jié)合觸景無限在地鐵場景的應(yīng)用,解讀邊緣計算端在實際場景應(yīng)用中遇到的問題及獨特的解決方案。
以下為趙寒偉分享內(nèi)容節(jié)選,AI 掘金志做了不改變原意的編輯。?
觸景無限與邊緣計算
?
邊緣計算原理與章魚相似,章魚 40%神經(jīng)元在大腦,60%神經(jīng)元在觸手,八只觸手可以感知接觸的信息,甚至可以做簡單的思考。觸手做了一部分大腦的工作,降低了大腦處理的工作量。邊緣計算就是分布式計算,在靠近傳感器的前端做一部分計算,計算結(jié)果直接反饋到前端和大腦。
現(xiàn)在大部分的架構(gòu)是云邊結(jié)合的方式,所以在邊緣端要具備快速處理的能力。比如,聲音傳感器聽到聲音后把攝像頭轉(zhuǎn)向聲音來源的角度,實際上是在邊緣端處理后的快速響應(yīng),如果把聲音指令傳到中心的云端,云端經(jīng)過計算再把指令傳到前端,此時可能聲音的景象已經(jīng)變化,所以快速在前端的反應(yīng)是邊緣計算的優(yōu)勢。另外,目前很多場景無法保障網(wǎng)絡(luò)的實時連通性和實時速度,最典型的自動駕駛,雖然有云端大腦,但汽車在行進中很難完全保障信號,所以車里都有相應(yīng)的邊緣計算設(shè)備去處理感知前端遇到的問題。
云端 AI 和嵌入式 AI,并不是對立的技術(shù),二者相結(jié)合才能滿足大部分的需求。在云端有豐富計算資源、加速快、可以支撐非常復(fù)雜的模型和算法,同時必須保障實時聯(lián)網(wǎng)環(huán)境;在邊緣端,基本都是嵌入式,算力有限,模型不能太復(fù)雜和龐大,要經(jīng)過優(yōu)化和壓縮,適用場景豐富。云端和邊緣端是相結(jié)合運作的。觸景無限在邊緣計算端有十年經(jīng)驗積累。首先,在感知算法、智能識別算法的積累,算法不僅僅包括視頻結(jié)構(gòu)化,聲音處理,各種傳感器處理,還有模型壓縮和模型優(yōu)化。
舉個例子讓大家理解一下算法壓縮與優(yōu)化,最近與我們合作的一個 AI 國企最多能把算法壓縮到 50M,繼續(xù)壓縮識別效率會下降,我們在邊緣端執(zhí)行的算法可壓縮到幾百 K,不到 1M,并且高度壓縮下識別效率沒有降低。這是我們在邊緣算法長期積累的一個體現(xiàn)。除了了解具體芯片的應(yīng)用場景特點,我們還具有算法和芯片高度融合與底層優(yōu)化,充分挖掘芯片算力的能力。比如,Intel Movidius 2450 芯片有 200G 算力,我們通過在芯片算法底層注入?yún)R編語言,改變它的數(shù)據(jù)準備、運算等,在實測中可以和市面上 1T 算力的芯片相當,這項能力的技術(shù)含量其實非常高。
我們把邊緣計算技術(shù)和經(jīng)驗積累注入到公司五大系列產(chǎn)品。邊緣計算單元,實際就是邊緣計算的設(shè)備,首先它可以接物聯(lián)網(wǎng)設(shè)備,其次它在邊緣端可以把接入的物聯(lián)網(wǎng)設(shè)備信號進行相應(yīng)的處理,然后轉(zhuǎn)換成能感知的東西,也可以做一些前端控制,這些數(shù)據(jù)通過安全加密的一種方式,傳輸?shù)皆贫?,這是邊緣計算單元的功能。這次疫情我們快速推出了瞬視體溫篩檢系列,利用紅外成像與可見光成像進行疊加運算,實現(xiàn)快速篩檢體溫,最高級的產(chǎn)品我們用的是 640*480 的紅外感知的芯片,1 分鐘通過測溫人數(shù)可以達到 780 人,在整個測溫市場,性能是非常高的。
盾悟系列主要是面向存量市場,比如高清攝像機不具備智能功能,加了這個盒子后普通的攝像機就具有人臉識別,人體、車輛的抓拍功能。角蜂鳥是我們與英特爾合作,基于人工智能的開發(fā)套件,主要是人工智能研發(fā)公司和教育培訓(xùn)機構(gòu),給學(xué)生上人工智能實訓(xùn)課,通過 USB 插上電腦,20 行代碼搞定人臉識別,這個可以檢測出 20 種實物模型,可以做快速的人工智能開發(fā),當然也可以開發(fā)模型,把里面的模型替換掉增加新的算法。
我們與 2000 多家公司和教育機構(gòu)在合作。瞬視系列是與攝像機廠商合作,面向市場提供智能攝像機,在攝像機里加一個邊緣計算的組件,有算法模型、芯片,讓相機變成智能相機,一個主要的場景是作為電子警察,在路口能檢測出 14-18 種違章行為,包括了行為分析、車輛檢測、人員檢測等。
感知城市的理解
?
物聯(lián)網(wǎng)和云發(fā)展多年,各個平臺的建設(shè)和打通都已經(jīng)完成得差不多了,為什么智慧城市依然沒有到來,因為基礎(chǔ)的感知還沒實現(xiàn)。感知技術(shù)的發(fā)展其實與物聯(lián)網(wǎng)技術(shù),邊緣感知技術(shù),云計算技術(shù)相關(guān),物聯(lián)網(wǎng)和云計算在十幾年前就出現(xiàn)了,但感知沒有得到快速推進,主要是芯片算力不夠,拖了智慧城市的后腿。智慧城市建設(shè)過程中離不開智能感知,包括水、能源、交通、綠地、金融等都離不開傳感技術(shù),有了傳感器就要做智能識別,識別后需要智能控制,所以在整個體系里,感知是非常重要的一個環(huán)節(jié)。
?
近年隨著芯片算力提高,邊緣計算成為非常重要的話題。2018 年麻省理工科技評論把感知城市列入全球十大突破性技術(shù)。近兩年城市數(shù)字化成為我們國家戰(zhàn)略,數(shù)字化經(jīng)濟中把一個城市數(shù)字化,需要傳感器把城市 3D 模型里各個數(shù)據(jù)上傳,才能形成一個真正的數(shù)字城市,很多數(shù)據(jù)是難以理解,所以就需要在芯片邊緣端計算,實現(xiàn)傳到中心端的東西,已經(jīng)是能夠讀懂的東西。
項目案例分享
?
今天分享的案例是地鐵人臉進站。之前城市地鐵的通行方案基本上是兩個,刷卡和二維碼??ㄒ讈G失,忘帶,損壞,并且退換卡麻煩;二維碼給大家提供了便捷,但高峰的時候網(wǎng)絡(luò)擁堵,二維碼打不開,造成人員擁堵,非常影響出行效率。這是目前地鐵通行方案存在的問題,很多探討刷臉進地鐵的方案,其實需要考慮的就幾個問題。
通行速度能不能保障?會不會有誤識別?刷錯扣款賬戶?使用人數(shù)多會不會影響處理能力?資金投入是否很大?
通行速度要保證在 200 毫秒左右?,F(xiàn)在暫時無法實現(xiàn)“從抓拍到人,人到閘機自動開”。因為目前是通過在閘機上裝一個小屏幕的讀頭方式。基本上是半配合式,乘客要稍微頓一下來提升通行速度。誤識別是人臉技術(shù)范疇,目前的技術(shù)很難達到 100%,這是難點。能達到 99%的識別率,就已經(jīng)不錯了。國家公安部的標準是 95%以上,但 95%對地鐵是無法忍受的。一個中等城市地鐵一天的人流量大概在 300 萬,300 萬人有 95%的誤識別率意味著多少人?所以要采用一些輔助性的手段來彌補人臉系數(shù)的先天短板。人數(shù)多的問題,考慮用預(yù)篩選和分級名單的方式,地鐵行業(yè)叫縮庫。
比如,整個城市有 1000 萬人注冊了人臉,但實際進站的人連 1 萬都不夠,一天總數(shù)可能 20 萬,這時候需要對進入地鐵站的人進行篩選。像北京這樣的城市,人臉庫注冊會達到上千萬,到上千萬的人臉庫里搜一個人的照片,至少 10 分鐘不一定能搜出來,地鐵公司也很有可能不愿意投入。所以我們要通過貼合實際的手段解決技術(shù)存在的問題。
這個方案有四個目標,一是構(gòu)建地鐵刷臉支付體系,提高管控能力;在此基礎(chǔ)上提升乘客出行體驗,比如直接刷臉進站解決東西多不方便拿手機等問題;另外也提高了公共安全能力。然后沉淀大數(shù)據(jù),把脫敏的數(shù)據(jù)進行數(shù)據(jù)管理和客戶行為分析,獲取數(shù)據(jù)更多的價值。當然這些信息都是保密的。
這個項目有三個技術(shù)關(guān)鍵點。
第一,人臉選優(yōu)技術(shù)。對鏡頭抓拍到的人臉進行跟蹤,攝像頭對暗光人臉區(qū)域補光,對比效果不好的側(cè)臉進行篩除,在整個過程中挑選最佳鏡頭。
第二,人臉預(yù)篩。地鐵在人流量高峰期,一個鏡頭可能有上百人,如果他們走到閘機面前再在千萬人的人臉庫檢索,依然需要等。從地鐵通道到閘機一般至少有幾十秒間隔,其實可以提前將云端人臉檢索出來,將檢索結(jié)果放到閘機上,當乘客走到閘機前時,快速識別通過。
第三是本地庫智能篩選。根據(jù)大數(shù)據(jù)分析技術(shù)構(gòu)建本地??蛶?,比如某人每天從 A 站進 B 站出,就可以在相應(yīng)站點緩存這些信息;還可以建 VIP 庫。
整個方案是怎樣實現(xiàn)的?乘客端下載手機 APP,注冊后云端系統(tǒng)收集了人臉等信息;然后綁定支付信息,連接計費系統(tǒng),同時云端把數(shù)據(jù)同步到地鐵人臉庫,預(yù)篩系統(tǒng)從乘客進站開始持續(xù)抓拍,在人臉庫中選取最佳人臉進行兩級預(yù)篩,然后將篩選信息快速下載到閘機端,這個過程最多持續(xù) 2 分鐘。
閘機快速比對后開門,所有進站的人信息放到進站人臉庫,出站時同樣在站內(nèi)做預(yù)篩,到所有進站人員庫里做比對,比對后在閘機開始識別,此時乘客進出記錄已經(jīng)發(fā)送到計費系統(tǒng),連接的電子錢包自動扣費。這是整體的方案構(gòu)成。這個方案給地鐵方帶來了先進的 AI 人臉識別技術(shù),從中美貿(mào)易戰(zhàn)看,國家已經(jīng)把人工智能和大數(shù)據(jù)等技術(shù)作為國家戰(zhàn)略技術(shù),所以不是用不用這些技術(shù)的問題,而是我們要通過這些技術(shù)的升級帶動整個行業(yè)和產(chǎn)業(yè)鏈的發(fā)展。
刷臉進站實現(xiàn)了乘客實名制,這里面一個重要角色就是銀行,銀行拿到人臉信息后,在其人臉庫做實名比對,提供大數(shù)據(jù)的人員畫像。大量人臉抓拍后,依據(jù)人臉的圖像,大概分析出性別、年齡段等屬性,有了這些信息,對于銀行和地鐵運營公司來講,基于這些脫敏后的數(shù)據(jù)做統(tǒng)計分析、決策分析;另外也提高了整個的安保能力,一些危急情況,比如抓犯罪分子,都可以到信息庫調(diào)相應(yīng)的數(shù)據(jù),看到這個人的行動軌跡,進出站點和時間。可以說,我們基本實現(xiàn)了方案的目標。
例如針對某中型城市有 128 個地鐵站,地鐵每天平均人流量大概幾萬人,高峰時段大概 300 萬人,我們的解決方案,每個站有 4 個站口,每個站口兩路抓拍攝像機,8 個視頻結(jié)構(gòu)化的終端,還有一臺視頻識別服務(wù)器,直接在站端識別。我們最終測試出每分鐘 53 個人的通行速度,這個速度比刷卡和二維碼快很多。這就是觸景無限在這 10 年時間沉淀出來的技術(shù)能力,算法與芯片的緊密結(jié)合,深挖芯片計算潛力,同芯片同模型性能表現(xiàn)遠遠超出業(yè)內(nèi)標準水平,產(chǎn)品更具競爭力。