加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • AI落地的冰與火
    • 端、邊AI將成為硬件廠商布局重點(diǎn)
    • 人才、高性價(jià)比算力是當(dāng)前競(jìng)爭(zhēng)核心
    • 前景遠(yuǎn)大光明,道路曲折漫長(zhǎng)
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI 2024:回望哇聲一片,前瞻道阻且長(zhǎng)

01/05 10:21
3757
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

過(guò)去的一年,ChatGPT拉開(kāi)全民AI的序幕,AI經(jīng)歷“iPhone時(shí)刻”。這一年,大佬入局、獨(dú)角獸“宮斗”、千模大戰(zhàn);這一年,AI芯片已經(jīng)成為不容忽視的產(chǎn)業(yè)力量,對(duì)于國(guó)產(chǎn)芯片來(lái)說(shuō),如何“戴著鐐銬”前進(jìn)成為產(chǎn)業(yè)突圍的重點(diǎn)……這是AI狂奔的一年,也是AI不斷刷新認(rèn)知的一年。

高漲也好,低潮也罷,我們不能孤立地看待這些現(xiàn)象。AI這一波發(fā)展背后,是應(yīng)用的快速變焦,炙手可熱的計(jì)算機(jī)視覺(jué)、智能語(yǔ)音等賽道暫時(shí)平靜,AIGC站上風(fēng)口,相伴而來(lái)的還有無(wú)止境的算力焦慮……

只有直面困難,才能更好地走向未來(lái)。新年伊始,<與非網(wǎng)>對(duì)話AI芯片領(lǐng)域幾家明星公司,聽(tīng)他們聊聊AI的難處和新機(jī)遇。

AI落地的冰與火

2023年,AI產(chǎn)業(yè)在生成式AI驅(qū)動(dòng)下邁向新臺(tái)階,迎來(lái)了爆發(fā)式增長(zhǎng),大語(yǔ)言模型以及多模態(tài)大模型成為AI產(chǎn)業(yè)發(fā)展的重要推手?;鸨耐瑫r(shí),國(guó)內(nèi)外大模型在大規(guī)模應(yīng)用和落地時(shí)也遇到了實(shí)際困難。

千芯科技董事長(zhǎng)陳巍認(rèn)為主要有三類(lèi):

第一,實(shí)際模型與客戶場(chǎng)景的匹配問(wèn)題。由于大模型精度和幻覺(jué)問(wèn)題,好的大模型業(yè)務(wù)產(chǎn)品需要與客戶協(xié)作深度打磨,單純使用RAG方法和向量數(shù)據(jù)庫(kù)增強(qiáng)可能還不夠,需要結(jié)合Pre-train使用Fine-tune或Instruct-tune,并且模型參數(shù)量較大且訓(xùn)練時(shí)間較長(zhǎng)。

第二,大模型部署的成本問(wèn)題。大部分AI廠商面臨大模型部署成本較高的問(wèn)題,通常需要7nm或工藝更先進(jìn)的算力芯片、12GB以上的存儲(chǔ),部署越多可能利潤(rùn)越低。

第三,國(guó)際大環(huán)境的客戶需求下降和下行問(wèn)題,當(dāng)然這也是國(guó)際和國(guó)內(nèi)普遍遇到的情況,不僅限于AI產(chǎn)業(yè)。

千芯科技董事長(zhǎng) 陳巍

“受到大的經(jīng)濟(jì)形勢(shì)、芯片行業(yè)周期的影響,整體來(lái)看,AI行業(yè)的落地和發(fā)展,今年還是低于預(yù)期的,不少下游環(huán)節(jié)反映,AI特性在應(yīng)用中并非強(qiáng)需求,市場(chǎng)導(dǎo)入的意愿,在目前的大背景下,并不強(qiáng)烈”,時(shí)擎科技總裁于欣表示,“AI還是需要算法和芯片更緊密的耦合,相對(duì)而言,前期的一次性投入會(huì)比較大。這對(duì)AI加速落地,形成了一定的障礙?!?/p>

時(shí)擎科技總裁 于欣

安謀科技市場(chǎng)總監(jiān)錢(qián)電生認(rèn)為,大模型帶來(lái)的挑戰(zhàn)主要體現(xiàn)在軟硬件兩方面:

硬件方面,由于主流的AI芯片都是針對(duì)并行計(jì)算而設(shè)計(jì)的,更適用于以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為主的架構(gòu)。而如今到了以Transformer架構(gòu)為主流的時(shí)代,則需要更多串行計(jì)算的能力以及足夠的存儲(chǔ)帶寬支持;此外,除了硬件算力的提升以外,如何提升計(jì)算的效率以及對(duì)內(nèi)存的利用和優(yōu)化,是眾多硬件廠商在大模型時(shí)代所面臨的最大挑戰(zhàn)。

軟件方面,大模型的輕量化、如何兼顧性能及精度、實(shí)現(xiàn)大模型在端側(cè)設(shè)備的部署等問(wèn)題,有待進(jìn)一步解決。

安謀科技市場(chǎng)總監(jiān) 錢(qián)電生

端、邊AI將成為硬件廠商布局重點(diǎn)

在Transformer大模型熱戰(zhàn)于云端之際,業(yè)界已經(jīng)看到了它在端側(cè)、邊緣側(cè)的市場(chǎng)機(jī)會(huì)。如何使Transformer在硬件設(shè)備尤其是端側(cè)和邊緣側(cè)硬件高效運(yùn)行,將成為硬件廠商未來(lái)的重點(diǎn)方向。

于欣表示,對(duì)于人工智能算法而言,模型的“大”和“小”,“專(zhuān)用”和“通用”都是相對(duì)的。很多垂直領(lǐng)域,十億參數(shù)量級(jí)的“大模型”開(kāi)始在邊、端部署。未來(lái)1-2年,時(shí)擎科技會(huì)繼續(xù)基于語(yǔ)音、視覺(jué)、影像等多模態(tài)智能交互和信號(hào)處理的應(yīng)用落地。同時(shí),也會(huì)密切關(guān)注并積極布局大模型在端側(cè)推理的進(jìn)展。

錢(qián)電生認(rèn)為,未來(lái)一到兩年,在硬件及架構(gòu)層面,伴隨著算力低成本、隱私、及時(shí)響應(yīng)等需求攀升,大模型的推理會(huì)逐步從云端向端側(cè)及邊緣側(cè)轉(zhuǎn)移,未來(lái)大模型推理市場(chǎng)規(guī)模遠(yuǎn)遠(yuǎn)大于訓(xùn)練市場(chǎng)已成為業(yè)內(nèi)共識(shí)。

Transformer仍是大模型的主流基礎(chǔ)架構(gòu),業(yè)界需要重點(diǎn)關(guān)注端側(cè)硬件對(duì)Transformer架構(gòu)的持續(xù)優(yōu)化所帶來(lái)的算力效率提升。同時(shí),也需要關(guān)注下一代新架構(gòu)的動(dòng)態(tài),例如微軟的RetNet、斯坦福的Mamba等,是否有機(jī)會(huì)挑戰(zhàn)Transformer的主流地位以及可能對(duì)硬件架構(gòu)設(shè)計(jì)產(chǎn)生的影響有待進(jìn)一步關(guān)注。

軟件層面,錢(qián)電生強(qiáng)調(diào),“大模型輕量化將成為規(guī)模化擴(kuò)展的關(guān)鍵,有望進(jìn)一步降低應(yīng)用成本并帶動(dòng)端側(cè)算力發(fā)展,業(yè)界需要重點(diǎn)關(guān)注大模型輕量化前沿技術(shù)與公司產(chǎn)品的深度融合,例如大語(yǔ)言模型推理框架、模型量化壓縮的最新算法等?!?/p>

同時(shí),面臨Meta公司LLaMA為代表的大模型引領(lǐng)的開(kāi)源風(fēng)潮,他認(rèn)為需要繼續(xù)重點(diǎn)關(guān)注新的開(kāi)源大模型,特別是面向端側(cè)的大模型(參數(shù)量<70億)的性能表現(xiàn),以及在手機(jī)、PC、智能汽車(chē)智能終端上落地的應(yīng)用場(chǎng)景。

在多模態(tài)領(lǐng)域,以Stable Diffusion為代表的開(kāi)源擴(kuò)散模型已成為文生圖領(lǐng)域的主流,未來(lái),需要進(jìn)一步關(guān)注多模態(tài)領(lǐng)域文生圖、文生視頻的最新技術(shù)趨勢(shì)及端側(cè)落地的應(yīng)用場(chǎng)景。

人才、高性價(jià)比算力是當(dāng)前競(jìng)爭(zhēng)核心

結(jié)合AI產(chǎn)業(yè)當(dāng)前的現(xiàn)實(shí)因素,哪些是稀缺動(dòng)力?陳巍認(rèn)為,核心是人才和高性價(jià)比的算力。從OpenAI的“宮斗戲”可以看到,人才是極力爭(zhēng)奪的關(guān)鍵,而不是數(shù)據(jù)和算法。對(duì)國(guó)內(nèi)市場(chǎng)來(lái)說(shuō),缺乏的不僅是算法人才,更多是算法應(yīng)用和工程人才。雖然很多開(kāi)源大模型已經(jīng)做得很不錯(cuò)了,但是落地時(shí)缺少合適的人才把大模型的優(yōu)勢(shì)發(fā)揮出來(lái)。

此外是高性價(jià)比的算力。國(guó)內(nèi)很多廠商已經(jīng)開(kāi)始大舉進(jìn)入AI領(lǐng)域,但在算力方面,受限于成本和可用的計(jì)算卡,推進(jìn)速度相對(duì)慢一些。特別是國(guó)內(nèi)有些優(yōu)秀的開(kāi)源大模型團(tuán)隊(duì),由于缺乏算力支持,有些很好的想法可能不一定有條件嘗試。

“也正因算力受限,國(guó)內(nèi)的AI產(chǎn)業(yè),特別是大模型技術(shù)的發(fā)展有些延緩”,陳巍談到,“盡管我們開(kāi)玩笑是‘百模大戰(zhàn)’、‘千模大戰(zhàn)’,但實(shí)際上針對(duì)國(guó)內(nèi)場(chǎng)景進(jìn)行了大規(guī)模底層Pre-train的國(guó)內(nèi)模型還較少,這使得國(guó)內(nèi)大模型的落地速度也有一定的延緩?!?/p>

前景遠(yuǎn)大光明,道路曲折漫長(zhǎng)

辯證看待AI產(chǎn)業(yè)當(dāng)前的發(fā)展現(xiàn)狀,其實(shí)困難往往也意味著新的機(jī)會(huì)。

陳巍談到,目前來(lái)看,解決大模型的精度和幻覺(jué)都需要更大的算力。積極效應(yīng)是對(duì)新架構(gòu)技術(shù)的發(fā)展產(chǎn)生了明顯推動(dòng)作用:一方面,越來(lái)越多國(guó)內(nèi)AI產(chǎn)業(yè)玩家在尋找能代替GPGPU的高性價(jià)比方案;另一方面,也在積極研究能降低算力需求的新型模型。在市場(chǎng)客戶需求帶動(dòng)下,同時(shí)給國(guó)內(nèi)AI產(chǎn)業(yè)和算力芯片的快速發(fā)展帶來(lái)了契機(jī)。

IP層面如何克服大模型的挑戰(zhàn)?錢(qián)電生表示,布局大模型相關(guān)的技術(shù)路線是必不可少的舉措,產(chǎn)品層面要更好地支持以Transformer為主的模型架構(gòu),比如在下一代“周易”NPU的設(shè)計(jì)上,安謀科技將會(huì)從精度、帶寬、調(diào)度管理、算子支持等多方面對(duì)主流大模型架構(gòu)進(jìn)行迭代優(yōu)化。同時(shí),IP廠商還需要聯(lián)合大模型算法廠商、模型輕量化廠商、OS/應(yīng)用側(cè)廠商等產(chǎn)業(yè)鏈合作伙伴在生態(tài)層面進(jìn)行深入合作,打造軟硬一體的端側(cè)大模型解決方案。

于欣認(rèn)為,只有把技術(shù)、場(chǎng)景和成本三者進(jìn)行更深度的有機(jī)融合,形成自己的技術(shù)壁壘,才能避免陷入到單純的價(jià)格戰(zhàn),從而有利于行業(yè)長(zhǎng)期的發(fā)展。未來(lái),一定還是場(chǎng)景驅(qū)動(dòng)技術(shù),而不是相反。這要求上游從業(yè)者深刻理解場(chǎng)景和業(yè)務(wù)模式,甄別形形色色的需求,去偽存真,在這個(gè)基礎(chǔ)上去打磨底層的算法、處理器、芯片,形成自己的差異化的競(jìng)爭(zhēng)優(yōu)勢(shì),才有可能在激烈的市場(chǎng)競(jìng)爭(zhēng)中破局突圍。

“隨著AIGC元年的到來(lái),未來(lái)5-10年會(huì)是AI行業(yè)發(fā)展的一個(gè)嶄新階段,AI芯片作為算力的基石,也一定會(huì)有更多的機(jī)會(huì)等待從業(yè)者去挖掘”,于欣強(qiáng)調(diào),“用一句話來(lái)形容目前AI產(chǎn)業(yè)的發(fā)展,我認(rèn)為是‘前景遠(yuǎn)大光明,道路曲折漫長(zhǎng)’?!?/p>

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
MC56F8323VFBE 1 Freescale Semiconductor 16-bit DSC, 56800E core, 32KB Flash, 60MHz, QFP 64

ECAD模型

下載ECAD模型
$14.69 查看
STM32F429ZIT6TR 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ARTAccelerator, FMC with SDRAM, TFT

ECAD模型

下載ECAD模型
暫無(wú)數(shù)據(jù) 查看
DSPIC33EP512MU810-I/PF 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP100, 14 X 14 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100
$9.69 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢(shì)。歡迎交流~