国产欧美久久一区二区三区,亚洲国产aⅴ精品一区二区久久

Socionext Inc. 與Takayuki Okatani 教授領導的日本東北大學研究小組合作，開發(fā)了一種新方法，可以減少 SLAM（同步定位和映射）所需的處理時間，這對于執(zhí)行自主控制的設備至關重要，時間僅為傳統(tǒng)技術所需時間的 1/60。這種新方法使得在一些CPU 性能有限以及功耗有限的邊緣設備的 SoC進行高級 SLAM 處理成為可能，例如自動駕駛汽車、AGV（自動導引車）、機器人、無人機和其他執(zhí)行自主的設備控制，以及諸如 AR（增強現(xiàn)實）眼鏡之類的設備。

該研究工作已被 ICCV（計算機視覺領域最負盛名的會議之一）接受為演講報告。這種新方法在 10 月 11 日至 17 日在線舉行的ICCV 2021會議上進行了介紹。

根據(jù)用于獲取物體周圍 3D 信息的傳感方法，SLAM 可以分為兩種主要類型。一種是 LiDAR（光探測和測距），它使用激光測量距離。另一種是Visual SLAM，它使用相機圖像。視覺 SLAM 正在顯著發(fā)展，因為所使用的相機相對便宜，并且除了同時定位之外，還可以將該方法與使用圖像識別的各種控制過程相結合，從而可以期待許多應用。

近年來，隨著深度學習的引入，圖像識別技術取得了顯著的進步，深度學習的應用成為了視覺SLAM演進的重要因素。然而，基于特征點和相機方向優(yōu)化地標的未知 3D 信息的束調整（BA）所需的大量計算是傳統(tǒng)方法的瓶頸。對于 CPU 處理能力有限的邊緣型 SoC 設備，這會使實際處理變得困難。（圖1）

（圖1）

為了應對這一挑戰(zhàn)，研究團隊提出了一種使用“圖網絡（GN）"[1] （一種圖神經網絡）通過推理進行近似計算的方法。新方法包括從 GN block輸入的關鍵幀和地標信息中推斷更新信息（圖 2），并通過多堆棧 GN 結構收斂到最終值（圖 3）。與使用傳統(tǒng) Levenberg-Marquardt 方法的標準束平差相比，這些使得推理處理所需的計算量更少。

（圖2）

（圖3）

研究團隊使用這種新的推理方法實現(xiàn)了 Visual SLAM 捆綁調整，并將其與當今廣泛使用的方法“g2o”[2]進行了比較。 PC 仿真結果證實，與 g2o 相比，新方法可以將處理時間縮短至 1/60。（圖 4）

（圖4）

Socionext 將從這項研究工作中積累經驗，并將 Visual SLAM 技術確立為公司定制 SoC 解決方案的產品之一。該公司將為工業(yè)設備和移動等需要圖像識別領域的客戶系統(tǒng)提出創(chuàng)新的性能改進方案。此外，公司將繼續(xù)研發(fā)通過新的推理方法提高處理效率，并將其使用擴展到圖像識別以外的新客戶應用。

Socionext 和日本東北大學顯著加快基于深度學習的 SLAM 處理

相關推薦