作者 |?劉佳藝,編輯?|?白雪
10 月,北京亦莊深秋的季節(jié)里,空氣格外冷冽。
與此同時,世界智能網(wǎng)聯(lián)汽車大會上的展廳內(nèi),人潮涌動。
臺下坐著的,是亦莊產(chǎn)投、蔚來、小米、經(jīng)緯恒潤等一眾投資者角色,他們目光交匯在一顆芯片上。
這顆芯片來自輝羲智能,這家初創(chuàng)企業(yè)用兩年時間,研發(fā)出第一顆數(shù)據(jù)閉環(huán)定義芯片——光至 R1。
造一顆芯片的難度,不亞于造車。
輝羲智能創(chuàng)始人徐寧儀把這項突破比喻為攀登上海拔 7500 米的慕士塔格峰。
登頂慕士塔格峰意味著達到國家一級運動員的標準,輝羲選擇把芯片對標 OrinX,代表其挺進了國際造芯第一梯隊。
- 7nm 制程,擁有 450 億個晶體管,符合車規(guī)級要求;500TOPS 算力,相當于兩顆 Orin;8 核 SIMT 架構(gòu),24 核 CPU,15 核 GPU;帶寬超過 200GB/s;
2025 年,光至 R1 將率先在一家國際車企上量產(chǎn)上車。
輝羲還定下目標,要讓這顆芯片成為國內(nèi)量產(chǎn)上車速度最快、業(yè)內(nèi)最好用的大算力智駕芯片。
芯片市場已經(jīng)群雄林立,前有英偉達等巨頭企業(yè)占據(jù)大量市場份額,后有黑芝麻、地平線等上市企業(yè)分食剩余市場蛋糕,輝羲想要沖出重圍,它需要做出更極致的動作。
這個極致包括產(chǎn)品性能、交付速度、降本增效等。
同時,輝羲必須保證,從決定造芯的那一刻開始,邁出的每一步都不容有錯。
01造芯方法論:打造可擴展的數(shù)據(jù)閉環(huán)
1950 年,阿蘭·圖靈在著作《計算機器與智能》中,描述了通向通用人工智能的兩條路徑:
- 基于抽象計算,聚焦抽象任務(wù)所需要的人工智能,做針對性算法訓(xùn)練,比如國際象棋;基于具身學(xué)習(xí),給機器配置傳感器,像人類幼兒一樣與環(huán)境互動,培養(yǎng)感知、學(xué)習(xí)與認知能力。
兩種路徑的區(qū)別是,前者依靠規(guī)則,應(yīng)用范圍有限,但上車快;后者強調(diào)智能,泛化性、適應(yīng)能力強,但要求極高的數(shù)字基建能力。
圖靈認為,這兩條路徑,都值得探索。
于是,在人工智能 70 年的發(fā)展脈絡(luò)中,兩條路徑以一種遞進式關(guān)系,迸發(fā)出了技術(shù)變革的巨大火花,形成四個階段的演進:
-
-
- 第一階段,
計算智能
- ,通過深度檢索與相應(yīng)算法,一臺名為「深藍」的超級計算機打敗了人類世界冠軍;第二階段,
-
感知智能,在 CNN 算法與 GPGPU 硬件協(xié)同下,機器完成了對十億級別人臉數(shù)據(jù)的記憶與檢索;第三階段,
認知智能,基于 Transformer 算法與專用芯片架構(gòu)的應(yīng)用,ChatGPT 展現(xiàn)出大語言模型的交互能力;第四階段,
具身智能,同樣在算法與硬件作用下,機器擁有了類人思維模式,真正接棒了探索、創(chuàng)造物理世界的任務(wù)。
隨著問題規(guī)模的增長,數(shù)據(jù)處理量級從 10ZB 進階到 1000ZB,算法結(jié)構(gòu)、硬件架構(gòu)進行了相應(yīng)擴展,指數(shù)級增長的性能要求得到滿足。
這種可擴展性的能力,充當了驅(qū)動技術(shù)變革的強力引擎。
現(xiàn)在的輝羲,就站在第四階段的端口,踏上了圖靈口中的第二條路徑。
它的任務(wù),是造出一顆支撐高階智能駕駛,滿足具身智能要求的高性能芯片。
而它的方法論已經(jīng)明確,正是瞄準算法、硬件的可擴展性,打造出高效的數(shù)據(jù)閉環(huán)。
建立在這條方法論之上,輝羲定義了首顆芯片的基本樣貌。
一是從數(shù)據(jù)閉環(huán)的系統(tǒng)需求出發(fā),在芯片設(shè)計上首次做到,一顆芯片,滿足三大應(yīng)用場景,即:數(shù)據(jù)采集:連接多條視頻處理鏈路,支持影子模式等;實時控制:在處理復(fù)雜運行工況時保持高幀率、高吞吐;算法驗證:數(shù)據(jù)解碼后進行回灌測試,完成推理訓(xùn)練。
二是在架構(gòu)設(shè)計上,滿足可編程性的要求。
輝羲把芯片架構(gòu)定位于「領(lǐng)域通用架構(gòu)」。
它介于傳統(tǒng) CNN 與 GPGPU 硬件架構(gòu)之間,既滿足重點領(lǐng)域性能要求,比如智能駕駛,同時支撐它的演進。
輝羲在分析了智能駕駛與具身智能算法特征之后,研發(fā)了一套圖靈完備的指令集。
圖靈完備,意味著這套編程語言,可以像圖靈機一般解決任何計算問題,它可以讓用戶,隨心所欲地支配先進算法,包括現(xiàn)在的端到端技術(shù)架構(gòu)。
由此,輝羲的光至 R1 展現(xiàn)出了對標英偉達 OrinX 的能力。
從參數(shù)對比可以直觀看到,根據(jù)已公開的數(shù)據(jù)信息,光至 R1 在制程、功能安全方面,都與 OrinX 保持在同一水平線,而在算力、CPU 性能方面,光至 R1 展現(xiàn)出一定優(yōu)勢,這意味它擁有更強大的通用計算能力。
在發(fā)布會上,徐寧儀以加速 Transformer 算法模型為例,結(jié)果是,光至 R1 的算子性能提升能力,是 OrinX 的 9 倍,甚至在個別配置上達到了近 20 倍。
毫無疑問,這是一顆原生于大模型時代,服務(wù)于領(lǐng)域通用計算的高性能芯片。高階智駕,是輝羲智能最直接的應(yīng)用場景。
02充分利用算力,裕量高達 60%
回溯神經(jīng)網(wǎng)絡(luò)模式的發(fā)展史,起初人工智能行業(yè)錨定的關(guān)鍵詞是「BEV」。
這種多傳感器結(jié)合鳥瞰圖的感知路線,成為自動駕駛識別障礙物的基本路徑。分辨率上升后,BEV 網(wǎng)絡(luò)模型由稀疏柵格進階為稠密柵格。
隨著感知精度的進一步提升,神經(jīng)網(wǎng)絡(luò)模型由二維轉(zhuǎn)變?yōu)槿S的 Occupancy 網(wǎng)格,能對通用空間障礙物進行判斷。
再往后,AI 技術(shù)的加持下,「端到端」網(wǎng)絡(luò)成為了各家競爭的主要籌碼。這種從感知到?jīng)Q策一體化的神經(jīng)網(wǎng)絡(luò)模型,能通過自我判斷應(yīng)對多樣化的極端場景。
需要強調(diào)的一點是,從「BEV」到「端到端」的模式演進過程中,算力成為了每個節(jié)點質(zhì)變的籌碼。
這與強化學(xué)習(xí)教父 Richard Sutton,在《The bitter lesson》中寫下的箴言構(gòu)成了回振。
Richard Sutton 認為,要充分利用算力,避免過度依賴人類知識,重視搜索與學(xué)習(xí)方法。這是最終,也是最有效的方法。
底層邏輯是摩爾定律,計算成本持續(xù)呈指數(shù)級降低,計算能力同樣不斷呈指數(shù)級提升。
這種負相關(guān)反應(yīng)貫穿始終,是人工智能技術(shù)突破的關(guān)鍵。
而輝羲,抓住了這把算力鑰匙,打開了摩爾定律的大門。
輝羲的光至 R1,清晰地定位于大算力芯片:
500TOPS的深度學(xué)習(xí)算力,意味著它能夠從容應(yīng)對各種新的模型結(jié)構(gòu)。同時,光至 R1 擁有高效的異構(gòu)計算能力。所謂異構(gòu)計算,是指在新的計算形態(tài)下,將不同類型的計算需求合理分配到不同的處理單元上,實現(xiàn)系統(tǒng)效率的最優(yōu)解。
光至 R1 配置了 CPU、NPU、GPU、ISP 等多樣的協(xié)同處理加速器,這些加速器在自動駕駛場景下,靈活分配對應(yīng)的計算需求,使得算力能夠進行充分配合,滿足系統(tǒng)可靠性、穩(wěn)定性的第一需求。
另外,輝羲給芯片性能加上了一道嚴謹?shù)陌踩谰€。
信息安全層面,光至 R1 在啟動和執(zhí)行過程中,除了常規(guī)解密算法外,還支持國密 SM2/3/4,確保用戶信息流安全。
而在功能安全方面,輝羲同樣在這顆僅有 7nm 芯片的復(fù)雜工程中,把道場做大。
在基本功能安全方式之上,輝羲新增了 RIF 架構(gòu),即一套分級、分域的診斷機制,讓用戶能夠根據(jù)系統(tǒng)設(shè)計的需求,靈活配置與裁剪不同的情況,可以在局部處理單元處理問題,也可以層層上報至外部獨立的 MCU 系統(tǒng)中。
這種創(chuàng)新性的安全設(shè)計,給車規(guī)級芯片做到有效把關(guān)。
總結(jié)就是,這是一張為自動駕駛服務(wù)的專業(yè)級芯片,它能夠形成一個強大的數(shù)字基座。
輝羲在這個基座上,基于「BEV+Transformer」的算法架構(gòu),打造出了高階城區(qū)無圖自動駕駛解決方案——RINA,支持不依賴高精地圖的城區(qū) NOA,具備從感知到路徑規(guī)劃的端到端處理能力。
徐寧儀表示,這套方案能夠?qū)崿F(xiàn) 60% 的算力裕量,系統(tǒng)層面可以做到降本 40%。
這意味著,即便出現(xiàn)計算要求更高的模型,光至 R1 能夠以一種高性價比的方式,輕松拉動數(shù)據(jù)、算法、算力三駕馬車。
03最快量產(chǎn)上車,12 個月內(nèi)完成交付
所謂三年磨一劍。
輝羲把這個時間,縮短到了兩年半,造出首顆芯片。
某種程度上,「高效」的確是當前自動駕駛行業(yè)中最具殺傷力的武器。尤其在各家都在拼端到端大模型上車的階段,誰交付越快,量產(chǎn)上車越早,誰就能在智能化下半場掌握更多話語權(quán)。
9 月底,輝羲光至 R1 流片成功后,立刻被交到了合作商手中,進而推動了 2025 年與國際車企的量產(chǎn)合作項目。
另外,高效這層價值建設(shè),也得益于輝羲在「好用」層面上的努力。
畢竟,芯片是一項系統(tǒng)性的大工程,它不局限于在硬件性能上造壁壘,而在于軟硬一體的穩(wěn)定性、可靠性能力,以及整個供應(yīng)鏈的協(xié)同性構(gòu)建。
這也是蔚來、小鵬等車企選擇自研芯片的原因,因為能夠從根源上滿足智能駕駛需求,掌控系統(tǒng)優(yōu)化全流程。
在這種背景下,芯片企業(yè)的供應(yīng)鏈服務(wù)能力排在了下游合作商的考核首位。
很顯然,輝羲在這點上也做得非常完善。
比如硬件層面,輝羲提供了進一步的硬件解決方案——RCM,這是搭載光至 R1 最小系統(tǒng)子卡,具備可插拔式設(shè)計,支持同一款母板,不同子板的即插即用,并與 Orin 生態(tài)做到兼容,未來還能實現(xiàn)整車所有接口設(shè)計不動,輕松升級算力;以及域控制器硬件的設(shè)計,支持一塊或兩塊子卡,單域控算力超過 1000T,是車上強悍的中央大腦。
在軟件層面,它設(shè)計了一套功能完備、用戶友好的 AI 工具鏈,能夠兼容常見的神經(jīng)網(wǎng)絡(luò)模型格式,將數(shù)據(jù)編譯成在芯片上高效運行的指令集。
值得一提的是,基于這套工具鏈,用戶在 30 天內(nèi)可以實現(xiàn)模型平臺的遷移,從而降低研發(fā)成本。
最后,通過這種體系化的建設(shè),輝羲能夠在 12 個月內(nèi),完成一個智能駕駛量產(chǎn)項目從啟動到交付的全過程。
實際上,輝羲對于高效能力上的注解,體現(xiàn)其對于芯片未來生態(tài)的前瞻性洞察,即懂技術(shù)、懂創(chuàng)新、懂車企的芯片企業(yè)才更具競爭力。
而輝羲從誕生起,就已經(jīng)置身于這個框架設(shè)定中。
翻開三位創(chuàng)始人的履歷,就能看到一種來自互聯(lián)網(wǎng)科技企業(yè)、車企、高校的同頻共振。
其中,徐寧儀曾擔任微軟亞洲研究院硬件計算組負責人、百度智能芯片部主任架構(gòu)師、陣量智能 CEO 等職位,是業(yè)內(nèi)少有的主導(dǎo)過多款 AI 芯片設(shè)計并實現(xiàn)大規(guī)模商用的 TOP 級專家;
章健勇曾任蔚來汽車自動駕駛助理副總裁,從零開始組建團隊并搭建自動駕駛技術(shù)平臺,主導(dǎo)過多個高階智駕項目的首發(fā)量產(chǎn);
賀光輝的身份則是上海交通大學(xué)教授、電子信息與電氣工程學(xué)院副院長,長期從事高能效數(shù)字系統(tǒng)芯片和高算力芯片互連技術(shù)研究,入選國家級高層次人才計劃。
由此,三位創(chuàng)始人基于學(xué)界、業(yè)界的不同語境,賦予了輝羲這家芯片企業(yè)正確、全面的戰(zhàn)略視角。
當然,這更不乏資本的高調(diào)關(guān)注。
成立兩年半時間內(nèi),輝羲已經(jīng)到達了 A 輪融資階段,融資金額達到數(shù)億元。
而在諸多投資者中,可以看到亦莊產(chǎn)投、國汽投資等產(chǎn)業(yè)角色,以及真格、卓源亞洲、朗瑪峰創(chuàng)投、元生資本等知名投資機構(gòu),還有一些供應(yīng)鏈上下游角色,比如經(jīng)緯恒潤、商湯科技這類智駕供應(yīng)商,以及小米、蔚來等車企,都對輝羲展現(xiàn)出極高興趣。
可以確定,首顆芯片的問世,意味著輝羲已經(jīng)給資本交出了一份優(yōu)秀答卷。
并且,這份答卷還不局限于智能駕駛范圍,輝羲把星辰大海定得更高遠——具身智能,在這個階段,需要面臨更復(fù)雜的三維空間任務(wù),與更加泛化的場景與交互類型。
而光至 R1 已經(jīng)展示出了應(yīng)對具身智能挑戰(zhàn)的能力,比如完成簡單的指令理解、動作控制與規(guī)劃等。
很顯然,躬身入局芯片市場,輝羲已經(jīng)在開端把調(diào)起高。這意味著,憑借芯片的高性能與快速的交付能力,它注定成為攪動芯片市場格局的一個新變量。