AI大模型公司孵出。
作者 | ?ZeR0
編輯 | ?漠影
芯東西7月1日消息,據(jù)《財新》報道,6月30日,由AI上市公司商湯孵化的GPU公司杭州曦望芯科智能科技有限公司(簡稱“曦望Sunrise”)向《財新》確認完成近10億元融資,投資方包括三一集團旗下華胥基金、第四范式、游族網(wǎng)絡、北京利爾、松禾資本和海通開元等。同日,曦望Sunrise公布曦望S2和曦望S3兩代產(chǎn)品。曦望S2目標實現(xiàn)萬片級量產(chǎn),可部署主流大模型,為企業(yè)級AI應用提供算力支持,性能對標國際一流產(chǎn)品,軟硬件兼容CUDA生態(tài),支持主流大模型和AI框架。曦望S3為大模型而生,定位為“下一代AI大模型推理芯片”,主打極致性價比,宣稱推理性能?x 3倍+,每單位Token推理成本降低90%。
曦望Sunrise定位為全棧AI算力芯片企業(yè),專注于高性能GPU及多模態(tài)場景推理芯片的研發(fā)與商業(yè)化,致力于成為“更懂AI的芯片公司”、提供“用得起、用得上的頂尖產(chǎn)品”。芯東西獲悉,曦望S1在2019年流片成功,是一款DSA架構(gòu)的云邊推理芯片,累計銷售超2萬顆;曦望S2是一款訓推一體GPGPU芯片,采用臺積電7nm工藝、2.5D CoWoS封裝、64GB HBM2e,TDP功耗為350W~450W,在2023年7月點亮,2024年已量產(chǎn)1000片,即將量產(chǎn)10000片;曦望S3采用全新芯片架構(gòu),預計2026年流片。曦望S2加速卡的FP32/TF32性能超過同樣采用7nm工藝的英偉達A100 SXM、接近H100 SXM,帶寬為1755GB/s,采用第五代PCIe接口(帶寬為128GB/s),C2C互聯(lián)帶寬為448GB/s。同時,曦望Sunrise提供全自研的AI計算引擎和軟件棧,軟硬件全面兼容CUDA,可高效支持常用開源大模型的預訓練、微調(diào)及訓練,支持Hugging Face等開源社區(qū)的開源大模型工具箱,以及PyTorch、DeepSpeed等AI框架。商湯自2018年啟動AI計算原型機預研,2019年發(fā)布SenseCore AI大裝置原型,并啟動自研AI芯片項目。今年5月30日,商湯發(fā)公告宣布,其聯(lián)合創(chuàng)始人徐冰有意專注于推動該公司及其生態(tài)體系中戰(zhàn)略性新興業(yè)務的發(fā)展,并已獲任AI芯片業(yè)務負責人,將致力于推動公司AI芯片等新興業(yè)務的突破與成長。
▲商湯5月30日公告截圖
據(jù)《財新》報道,曦望Sunrise在2024年從商湯拆分獨立,聯(lián)席CEO王湛曾是百度副總裁,曾參與建立百度搜索推廣系統(tǒng)“鳳巢”,被稱為百度的“推廣之父”,于2016年4月離職。另一名聯(lián)席CEO王勇曾在AMD從事芯片業(yè)務,曾在百度昆侖芯擔任副總裁,2020年加入商湯,擔任研發(fā)總監(jiān)。根據(jù)曦望Sunrise官網(wǎng),該公司源于AI頭部企業(yè)的孵化,對AI軟件、算法框架和行業(yè)場景應用有著深刻認知,團隊兼具頂尖芯片設計經(jīng)驗和AI軟件開發(fā)能力,擁有全自研的指令集、AI計算引擎和軟件棧,可實現(xiàn)芯片在高效計算方面的全自主化。曦望Sunrise提供一站式AI算力解決方案,從芯片到系統(tǒng),涵蓋硬件產(chǎn)品、軟件棧、算法優(yōu)化和落地部署的完整AI解決方案體系:
- 硬件產(chǎn)品:推理計算加速卡、服務器、大模型一體機
- 軟件棧:自研AI軟件棧、CUDA兼容生態(tài)、主流框架支持
- 算法能力:大模型適配優(yōu)化、AI算法平臺、場景定制算法
- 落地服務:全周期工程化部署、技術支持、生態(tài)合作
其場景應用包括AI大模型推理、綜合算力平臺、大模型一體機、智能制造、金融服務、智慧醫(yī)療與教育。另據(jù)企業(yè)公開查詢平臺企查查,杭州曦望芯科智能科技有限公司成立于2025年6月,注冊資本為2000萬元,法定代表人是閆嘉寶,由上海陣量智能100%持股。上海陣量智能成立于2020年5月,注冊資本為5億元,法定代表人是曦望Sunrise聯(lián)席CEO王勇。今年,曦望Sunrise已進行兩次融資。
▲陣量智能企查查頁面中,曦望Sunrise融資歷程及核心人員介紹(來源:企查查)