加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 硅基流動成AI應(yīng)用[賣鏟人]
    • 核心產(chǎn)品體系已初步成型
    • AI Infra的重要性逐步顯現(xiàn)讓賽道收益
    • 結(jié)尾:
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

產(chǎn)業(yè)丨聚焦AI Infra賽道,硅基流動AI應(yīng)用的“賣鏟人”

07/20 08:25
1896
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | 方文三

在當前的年度背景下,特別是針對國內(nèi)市場,大模型的落地實施將主要聚焦于to B服務(wù)領(lǐng)域。隨著大模型推理部署的成本持續(xù)下降,to C的應(yīng)用探索也將逐漸增多,這有望為市場帶來更多創(chuàng)新型的超級應(yīng)用,從而推動整個行業(yè)的進一步發(fā)展。

硅基流動成AI應(yīng)用[賣鏟人]

近日,硅基流動(SiliconFlow)成功完成了總金額接近億元人民幣的天使+輪融資。

此次融資由某知名產(chǎn)業(yè)方擔任領(lǐng)投角色,跟投方涵蓋了智譜AI、360以及水木清華校友基金等業(yè)內(nèi)知名企業(yè)及機構(gòu),同時,老股東耀途資本亦繼續(xù)以超額額度參與本輪融資。

針對公司未來的發(fā)展規(guī)劃,硅基流動將重點聚焦于技術(shù)產(chǎn)品創(chuàng)新以及全球商業(yè)化的推進。

公司將持續(xù)優(yōu)化自主研發(fā)的SiliconLLM和OneDiff推理引擎,致力于提升模型的推理效率和用戶體驗。

此外,硅基流動還將對SiliconCloud平臺進行進一步升級,持續(xù)推出高效能、低成本的AI模型云服務(wù)。

硅基流動的創(chuàng)始人袁進輝,曾任OneFlow和微軟亞洲研究院的主管研究員,其研發(fā)的LightLDA系統(tǒng)曾榮獲微軟亞洲研究院院長的特別嘉獎。

硅基流動成立于2023年8月,旨在構(gòu)建規(guī)?;?、標準化、高效能的生成式AI計算基礎(chǔ)設(shè)施平臺。

公司提供包括模型云服務(wù)平臺SiliconCloud、大語言模型推理引擎SiliconLLM、高性能文生圖/視頻加速庫OneDif等在內(nèi)的多款產(chǎn)品,助力企業(yè)和個人用戶高效部署AI模型。

2016年起,袁進輝所帶領(lǐng)的OneFlow團隊作為世界范圍內(nèi)唯一專注于研發(fā)工業(yè)級通用深度學習框架的創(chuàng)業(yè)團隊,成功推出了高性能分布式深度學習框架。

隨著以大模型GPT為代表的技術(shù)熱潮興起,OneFlow團隊所積累的大模型訓練技術(shù)和認知得到了充分驗證。

2023年,OneFlow團隊在處于大模型風口之際,被原美團聯(lián)合創(chuàng)始人王慧文所創(chuàng)立的大模型公司[光年之外]并購。

隨后,[光年之外]因故被美團并購,袁進輝帶領(lǐng)團隊創(chuàng)立了新公司[硅基流動]。

與大廠相比,硅基流動的核心優(yōu)勢體現(xiàn)在兩方面。

①公司具備深厚的大模型技術(shù)積累與創(chuàng)新,擁有頂尖的AI Infra技術(shù)能力團隊和作品,原班技術(shù)團隊在業(yè)界已打造出開源訓練框架OneFlow。

②其次,作為創(chuàng)業(yè)團隊,硅基流動能夠快速捕捉到行業(yè)需求的變化,并靈活作出相應(yīng)的適配。

截至目前,硅基流動已經(jīng)歷了兩輪融資。今年1月,公司完成了上一輪5000萬元的天使輪融資,由創(chuàng)新工場領(lǐng)投,耀途資本、奇績創(chuàng)壇、美團聯(lián)合創(chuàng)始人王慧文等跟投,投后估值達數(shù)億元人民幣。

核心產(chǎn)品體系已初步成型

硅基流動自主研發(fā)的SiliconLLM大模型推理引擎,經(jīng)過對內(nèi)核、框架、機制及模型的深度優(yōu)化,實現(xiàn)了業(yè)界頂尖的推理效率,其速度相較于同類開源產(chǎn)品,顯著提升超過十倍。

在應(yīng)對MoE架構(gòu)、超長上下文處理和超低延遲等復雜場景時,硅基流動的產(chǎn)品展現(xiàn)出業(yè)界領(lǐng)先的實力。

硅基流動近期推出了一站式云服務(wù)平臺SiliconCloud,該平臺致力于提供高效能、低成本的多品類AI模型服務(wù)(MaaS)。

SiliconCloud不僅集成了全球最新、最頂尖的開源模型,還通過自研的推理引擎套件(SiliconLLM & OneDiff)顯著降低了大模型推理的成本,為用戶提供了卓越的性能體驗。

這使得開發(fā)者能夠?qū)W⒂诋a(chǎn)品創(chuàng)新,無需擔憂大規(guī)模推廣所帶來的高昂算力成本。

SiliconCloud匯聚了眾多主流大模型,包括阿里旗下的通義大模型Qwen2、智譜旗下的GLM-4、幻方量化旗下的DeepSeek V2系列開源模型,以及文生圖模型SDXL、SDXL Lightning、PhotoMaker、InstantID等。

基于硅基流動在AI Infra領(lǐng)域的深厚積累,SiliconCloud平臺上的大模型展現(xiàn)出更快的響應(yīng)速度和更低的算力成本,極大提升了AI應(yīng)用開發(fā)效率,并顯著降低了部署成本。

例如,使用SiliconCloud調(diào)用文生圖模型Stable Diffusion,可以實現(xiàn)1秒出圖的高效能;

而調(diào)用大模型DeepSeek V2時,其響應(yīng)速度可達50 Tokens/s。

這得益于SiliconCloud集成的視頻生成推理引擎OneDiff,它使文生圖模型SDXL的性能加速最高可達3倍。

AI Infra的重要性逐步顯現(xiàn)讓賽道收益

AI Infra(人工智能基礎(chǔ)設(shè)施)指的是在大模型生態(tài)系統(tǒng)中,除了算力之外,為支持大模型訓練和部署流程所構(gòu)建的一系列底層軟件技術(shù)設(shè)施。

這些設(shè)施為開發(fā)者提供了便捷高效的設(shè)計模型或使用模型的環(huán)境,無需過多關(guān)注底層算力資源的調(diào)配。

AI Infra層,作為銜接AI應(yīng)用層算力芯片層的中間環(huán)節(jié),其在當前大模型時代背景下扮演著類似[操作系統(tǒng)]的核心角色。

面對如何優(yōu)化大模型訓練與推理的效率,充分發(fā)掘底層硬件的潛能,并降低生成式AI應(yīng)用開發(fā)的門檻與成本等挑戰(zhàn),AI Infra層承擔著解決這些關(guān)鍵問題的重任。

隨著ChatGPT等技術(shù)的火熱,大模型及其相關(guān)應(yīng)用持續(xù)涌現(xiàn),作為連接算力和應(yīng)用的AI中間層基礎(chǔ)設(shè)施,AI Infra的技術(shù)和商業(yè)發(fā)展前景備受矚目。

當前,大模型的發(fā)展尚處于初期階段,快速構(gòu)建和訓練調(diào)優(yōu)模型成為行業(yè)關(guān)注的焦點。

然而,隨著行業(yè)的逐漸成熟和應(yīng)用層的蓬勃發(fā)展,基礎(chǔ)設(shè)施的支撐作用將日益凸顯。

AI Infra不僅為應(yīng)用開發(fā)者搭建了與硬件和模型之間的橋梁,提升了開發(fā)效率和創(chuàng)新能力,還能有效滿足市場對高性能、低成本AI解決方案的迫切需求。

在國內(nèi),AI Infra領(lǐng)域的創(chuàng)新企業(yè)包括無問芯穹、清程極智等,二者均背靠清華大學,得到了來自智譜AI等投資者的支持。

其中,無問芯穹由清華大學電子工程系主任汪玉發(fā)起,創(chuàng)始人夏立雪為其學生;而清程極智的創(chuàng)始人則來自清華計算機系。

在國際上,英偉達、亞馬遜、Lepton AI、OctoAI等企業(yè)以及伯克利大學開發(fā)的vLLM等也在此領(lǐng)域展開競爭。

與文心一言、通義千問等應(yīng)用層大模型產(chǎn)品相比,硅基流動所聚焦的AI Infra賽道更注重連接算力和應(yīng)用的AI中間層基礎(chǔ)設(shè)施,涵蓋了數(shù)據(jù)準備、模型訓練、模型部署和應(yīng)用整合等多個環(huán)節(jié)。

據(jù)中金數(shù)據(jù)預(yù)測,目前AI Infra產(chǎn)業(yè)正處于高速增長的發(fā)展初期,預(yù)計未來3—5年各細分賽道有望保持超過30%的高速增長。

結(jié)尾:

展望未來,隨著模型的不斷升級、架構(gòu)的優(yōu)化以及定制芯片等降本增效措施的深入推進,AI應(yīng)用的盈利能力有望實現(xiàn)顯著提升,進而逐步凸顯AI應(yīng)用層的價值。

在此過程中,與開發(fā)者緊密關(guān)聯(lián)的AI Infra生態(tài)位將展現(xiàn)出顯著的優(yōu)勢。

同時,值得注意的是,未來AI模型的參數(shù)量將呈現(xiàn)持續(xù)增長的趨勢。

當模型規(guī)模擴大,現(xiàn)有的深度學習框架可能無法滿足開發(fā)者的實際需求,這就要求對底層的AI框架進行重構(gòu)。

這不僅是技術(shù)進步的必然,也為創(chuàng)業(yè)公司提供了新的發(fā)展機遇。

部分資料參考:創(chuàng)投日報:《智譜AI、360都投了這家AI應(yīng)用[賣鏟人]》,智能涌現(xiàn):《袁進輝新公司「硅基流動」獲近億元天使+輪融資》,每日經(jīng)濟新聞:《硅基流動完成近億元天使+輪融資》,金角財經(jīng):《國產(chǎn)AI,逃過一劫》,IPO早知道:《硅基流動再獲近億元天使+輪融資》,晚點LatePost:《光年之外聯(lián)創(chuàng)再出發(fā),與袁進輝聊 AI Infra到底做什么》,AI科技評論:《OneFlow 袁進輝再創(chuàng)業(yè),成立新公司「硅基流動」》

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
MK60DN512VMC10 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 512KB Flash, 100MHz, Ethernet, MAPBGA 121
$10.69 查看
ATMEGA128A-MUR 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64QFN
$7.34 查看
STM32F103CBT6 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 128 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下載ECAD模型
$11.49 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

AI芯天下是智能芯片行業(yè)垂直自媒體。采用媒體+行業(yè)的模式,堅持從芯出發(fā),用心服務(wù)的理念,致力于豐富的網(wǎng)絡(luò)基礎(chǔ)資源建設(shè)。官網(wǎng):http://www.world2078.com/ 公眾號:World_2078

TA的熱門作品
產(chǎn)業(yè)丨玻璃基板越發(fā)強勢,AI時代下或?qū)⒂兴鳛?>
				</a>
							</li>
						<li id= 深度丨谷歌發(fā)布自研量子芯片Willow,試圖解決量子計算的糾錯問題
  • 產(chǎn)業(yè)丨關(guān)注關(guān)鍵零部件核心競爭力,日本正拆解國產(chǎn)新能源
  • 產(chǎn)業(yè)丨LiveBench榜單比拼,階躍星辰成為國內(nèi)大模型第一
  • 產(chǎn)業(yè)丨吉利6.88億入局UAM,低空賽道冰火兩重天
  • 查看更多