機器視覺作為機器人賽道的核心應用之一,成長潛力持續(xù)發(fā)酵。結合光學裝置和傳感器的機器視覺系統(tǒng),能夠自動接收和處理真實物體圖像,獲得所需信息或控制機器人運動。其核心芯片包括AI芯片、圖像傳感器、存儲器、處理器和通信芯片等,這些芯片協(xié)同實現(xiàn)了機器人視覺的功能和應用。
機器視覺涵蓋AI、計算機科學、圖像處理、模式識別等諸多領域技術,擁有精度高、速度快、可靠性高等優(yōu)勢。在機器視覺應用領域,核心芯片以國外品牌為主,國內(nèi)芯片仍處于發(fā)展初期階段,不過據(jù)<與非網(wǎng)>調(diào)研,隨著機器人市場的不斷發(fā)展,視覺和計算技術的不斷成長,國產(chǎn)芯片在逐步進入應用階段。
3D視覺是突出趨勢
近年,機器視覺最大的趨勢來自3D視覺技術的突破,進一步推動視覺技術在高端機器人場景的應用。不過,工業(yè)應用中常見的拆碼垛、定位、分揀等場景下同質化競爭較多,3D視覺將逐步向更高階的場景延伸,比如焊接、檢測、裝配等場景,并且在機器人引導(例如移動機器人+3D 視覺、機械臂+3D視覺)場景應用前景廣闊。
相比 2D 機器視覺,3D 機器視覺具有顯著優(yōu)勢,例如測量速度快、精度高、抗干擾能力強、操作簡便等,能有效解決2D機器視覺對于高度、厚度、體積、平面度等測量因素缺失的問題。不過,也正是由于比2D視覺應用多了數(shù)據(jù)維度,3D視覺計算芯片整體數(shù)據(jù)的存儲、計算以及相關算法都變得更加復雜,需要具備較強的計算能力。
目前,國內(nèi)具有相關芯片研發(fā)能力的公司包括肇觀電子、銀牛微電子、中科融合、靈明光子、炬佑智能、元橡科技、埃瓦科技、視海芯圖等。
肇觀電子的SoC芯片NE-D163A能夠實時輸出深度圖像,以及進行實時計算機視覺特征處理。同時,還具備AI計算能力,在INT8和FP16精度下,D163A運行各項網(wǎng)絡均可達到較高的每TOPs每秒處理幀數(shù)。
銀牛微電子的NU4100視覺AI處理器中采用了芯原的雙通道ISP IP,具備3D深度感知、AI處理和片上基于視覺的實時定位與建圖 (VSLAM),可以低功耗、低延遲地處理來自多個4K攝像頭的數(shù)據(jù)。NU4100采用了優(yōu)化的嵌入式視覺架構,可高效整合計算機視覺引擎和深度學習 (CNN) 處理等一系列計算模塊。
中科融合的3D視覺解決方案主要基于兩顆自研的核心芯片:一是MEMS微振鏡芯片,據(jù)稱主要替代TI DLP芯片,成本可以降低4倍、功耗降低10倍、體積降低20倍。二是3D AI VDPU SoC芯片,主要是進行光學數(shù)據(jù)處理和系統(tǒng)控制。通過這兩個芯片形成模組,可以在達到同類競品相同成像效果和體驗的情況下,實現(xiàn)功耗、成本、體積大幅度降低。
此外,3D視覺整體方案提供商奧比中光也在自研芯片,一類是深度引擎芯片,貼片在3D 視覺傳感器PCB板上,實現(xiàn)3D視覺感知中最核心的深度信息的計算功能;另一類是專用感光芯片,根據(jù)3D感知成像的特殊要求,自主定義及設計芯片內(nèi)用于感光的像素微結構、用于計算的讀出電路部分、去噪模塊,與深度引擎芯片配合,將較目前通用感光芯片大幅提升產(chǎn)品系統(tǒng)性能。
機器視覺主芯片路線豐富
機器人視覺系統(tǒng)通常需要一個強大的處理器來處理和執(zhí)行各種任務,如圖像處理、計算機視覺、物體識別等,其處理器可以是CPU、GPU、FPGA或其他類型的處理器。當前。融合了AI特性和處理器功能的AI視覺芯片正在成為一大趨勢,負責處理和執(zhí)行各種機器學習算法和深度學習算法。
AI視覺主芯片可以簡單區(qū)分為GPU、CPU/集成GPU、帶NPU的SoC、FPGA、以及RISC-V架構芯片等。這些芯片分別面向不同的應用和用戶類型,也各自呈現(xiàn)出不同的發(fā)展趨勢。
其中,基于GPU的開發(fā)板可能是許多用戶剛開始AI開發(fā)時就接觸到的,比如NVIDIA TX2或Nano,AMD的APU SoC等。這類產(chǎn)品最大的優(yōu)勢是生態(tài)完善,不論是Tensor Flow、Caffe、PyTorch或是AI庫等,運行起來都很流暢,開發(fā)體驗也比較好。
第二類CPU/集成GPU,主要針對中低算力需求的應用,只需已有的CPU或是集成GPU就可以滿足。優(yōu)勢在于整體硬件成本更低,且方案成熟;缺點就是算力不夠大,不能支持太大的AI模型。
第三類是帶NPU的SoC,已經(jīng)越來越成為AI視覺主芯片的一大趨勢,它們將NPU與主處理器集成在一起,可滿足中高算力需求。由于是單芯片,硬件成本也適中,挑戰(zhàn)主要在于模型的量化部署方面,以及模型部署工具的成熟度,主要依賴于芯片廠商成熟的工具鏈支持。
除了這類單芯片設計,市面上還有一類神經(jīng)計算加速棒產(chǎn)品,可以通過USB插到板卡上提供運算能力。但是這類方案需要進行相互之間的數(shù)據(jù)傳輸,對于整體的方案設計、硬件的穩(wěn)定性等都有一定挑戰(zhàn)。
第四類基于FPGA的主控芯片,主要滿足對實時性要求較高的工業(yè)級應用。挑戰(zhàn)在于開發(fā)難度,涉及一些自研AI加速FPGA邏輯,需要底層的加速設計和量化方案設計,以及相應的轉換、編譯。
第五類是RISC-V架構的芯片,近兩年得到了較大的發(fā)展。由于需要進行圖像處理,這類芯片往往需要采用RISC-V主處理器+ISP或Arm CPU+RISC-V協(xié)處理器的異構形式,以應對更大的算力需求和更高的圖像處理性能。
以下是部分具有代表性的國產(chǎn)視覺處理芯片:
瑞芯微RV1109是一款高性能機器視覺處理器的SoC,基于雙核ARM Cortex-A7,集成了NEON和FPU。內(nèi)置的NPU支持INT8/INT16混合操作,計算能力可達1.2TOPs。RV1109還引入了基于硬件的5000萬像素ISP和后處理器。實現(xiàn)了IPC和CVR中常用的加速算法。瑞芯微在投資者互動平臺上表示,公司的芯片產(chǎn)品應用領域廣泛,已應用于多種形態(tài)的機器人產(chǎn)品,比如掃地機器人、教育機器人、服務機器人、工業(yè)/農(nóng)業(yè)機器人等。
全志科技的V853集成了新一代星光級畫質引擎,內(nèi)置的最新一代Smart視頻編碼引擎,集成單核Cortex-A7@lGHz、RSIC-V@600MHz及最大IT算力 NPU,支持16-bit DDR3/DDR3L最高速率933MHz,能夠滿足多種應用算力及帶寬需求。
清微智能TX510是一款面向IoT設備的超低功耗視覺處理芯片,基于可重構計算架構,內(nèi)置3D引擎支持AlexNet、GoogleNet、ResNet、VGG等主流神經(jīng)網(wǎng)絡,可實現(xiàn)人臉識別、物體識別、手勢識別、目標跟蹤等功能。支持3D結構光,支持3D活體檢測、紅外活體檢測、可見光活體檢測等。
勘智K510是嘉楠公司推出的第二代AI邊緣側推理芯片,提供高性能的圖像及語音處理能力。K510-CORE是核心模組,板載一顆K510芯片,CPU采用雙核64bit RISC-V架構,K510搭載自主研發(fā)的第二代神經(jīng)網(wǎng)絡處理器KPU2.0,采用計算數(shù)據(jù)流技術,算力較上一代提升3倍同時降低功耗。
AR9341集成了酷芯微電子自研的第二代HiFi-ISP技術,在2D降噪、3D 降噪、HDR、去霧、邊緣增強等各方面水平較高,同時內(nèi)部集成紅外熱成像圖像增強的技術,具有更加廣泛的適應性。集成的4K級 ISP、H264/265視頻編、解碼器(9M@60fps)可保證其輸出高質量的視頻,相比酷芯上一代的產(chǎn)品性能提升了100%。
富瀚微FH8898是全高清實時高性能智能網(wǎng)絡處理器 SoC 芯片,最高幅面支持4K。集成了2.0TOPS 算力的高性能神經(jīng)網(wǎng)絡處理引擎,4核RISC 處理器,同時集成了高性能的ISP 圖像處理模塊和視頻編解碼器。芯片可外接32 位寬高速DDR3 和DDR4 存儲芯片,支持USB3.0 接口和其他豐富的應用外設接口。富瀚微在投資者互動平臺表示,公司芯片除了可應用于高要求專業(yè)場景的工業(yè)機器人,更廣泛出現(xiàn)在生活場景:超市貨架機器人、酒店送餐機器人、家庭下棋機器人等多元化的場景。
國產(chǎn)芯片沖刺高端CIS
機器人視覺系統(tǒng)也對CIS提出更高要求。采用全局快門模式的 CIS 中,每個像素處都增加了采樣保持單元,使得所有的像素可以同時用于捕獲圖像,從而避免了在高速拍攝場景下因每行像素曝光時間差異而形成的“果凍效應”。
CIS 是CMOS 攝像模組實現(xiàn)成像的核心元件,約占據(jù) CMOS 攝像模組價值的 52%。CIS 的技術突破主要集中在對一定價格區(qū)間內(nèi)極致性能的追求上,如何在有限的空間和預算內(nèi),實現(xiàn)較大的光學尺寸(由像素顆粒大小與像素數(shù)目共同決定),從而實現(xiàn)優(yōu)質的感光性能,成為了技術突破的焦點。由此,衍生出了 Stack(堆棧)等結構更復雜的 CIS 產(chǎn)品。
Gartner曾預測,CIS預計將成為第一批中國占據(jù)全球份額10%以上的半導體品類之一。根據(jù)Yole Intelligence發(fā)布的2022年全球CIS(CMOS圖像傳感器)行業(yè)現(xiàn)狀報告,2022年全球CIS行業(yè)收入為212.9億美元。索尼以42%市場份額排名第一,三星以19%份額排名第二,豪威科技(Omnivision)以11%份額排名第三,此外,國內(nèi)廠商還有格科微(Galaxycore,4%份額)、思特威(Smartsens,2%)位列前十。這些國產(chǎn)芯片廠商在中低端領域形成一定市場基礎后,也有望向高端應用進擊。
寫在最后
機器視覺被認為是新藍海,特別是在機器人領域,隨著各類智能技術與機器人終端結合,將對視覺系統(tǒng)提出更多應用需求。
3D視覺市場就在飛速發(fā)展,國產(chǎn)3D視覺芯片玩家的成長和入局,就印證了這一趨勢。未來,3D視覺應用或將滲透更多場景。此外,在視覺計算芯片方面,市場競爭也將更加激烈。
未來,機器人視覺系統(tǒng)的增量主要在于機器人的落地和應用領域的拓寬,不過,下游細分場景需求較為碎片化,需要積累、以及相應解決方案的定制開發(fā),導致新場景的落地速度可能慢于預期,芯片國產(chǎn)化率的提升也需要恒久發(fā)力。