算力升維賽打響,阿里亮出新王牌。
在2022云棲大會(huì)上,阿里云智能總裁張建鋒宣布,阿里平頭哥自研云原生處理器倚天710已大規(guī)模部署應(yīng)用,成為中國(guó)首個(gè)云上大規(guī)模落地的自研CPU。
作為阿里首款自研服務(wù)器CPU,倚天710自去年10月推出以來(lái)已落地了數(shù)據(jù)庫(kù)、大數(shù)據(jù)、視頻編解碼等多個(gè)場(chǎng)景。張建鋒說(shuō),應(yīng)用倚天710云實(shí)例,算力性?xún)r(jià)比提升超30%,單位算力功耗降低60%,未來(lái)兩年20%的新增算力將使用自研CPU。
阿里云智能總裁張建鋒
當(dāng)下,算力成為像水力、電力一樣重要的生產(chǎn)要素,云計(jì)算已融入到人們生產(chǎn)生活的方方面面。如何進(jìn)一步提高算力效率以滿(mǎn)足數(shù)字化轉(zhuǎn)型需求?這成為全球科技公司關(guān)注的議題。
芯片、操作系統(tǒng)和上層應(yīng)用的原生融合已是大勢(shì)所趨,未來(lái)十年,軟硬件一體化的自研技術(shù)體系或?qū)⒊蔀樗懔?jiān)突破的關(guān)鍵??v觀(guān)阿里技術(shù)發(fā)展脈絡(luò),其已從軟件深入到硬件,并涉足技術(shù)門(mén)檻極高的通用CPU領(lǐng)域。
在當(dāng)下CPU領(lǐng)域,流片不再稀奇,能規(guī)?;涞氐?ldquo;好用”處理器卻不多。倚天710的規(guī)模化落地?zé)o疑再度刷新互聯(lián)網(wǎng)公司造芯的天花板水平。
那么倚天710是如何在推出一年多快速落地的?這又如何影響阿里乃至算力產(chǎn)業(yè)的發(fā)展道路?本文對(duì)此進(jìn)行了深入探討。
自研CPU大規(guī)模落地,性?xún)r(jià)比提升30%
2022年科技圈的主題是產(chǎn)業(yè)落地,在2022云棲大會(huì)現(xiàn)場(chǎng),關(guān)于倚天710的新消息印證了這一趨勢(shì)。
創(chuàng)立于中國(guó)廣州的匯量科技是一家營(yíng)銷(xiāo)SaaS企業(yè),為全球超95個(gè)國(guó)家客戶(hù)提供服務(wù)。匯量科技首席AI官朱小強(qiáng)說(shuō):“隨著廣告模型結(jié)構(gòu)不斷升級(jí),在線(xiàn)推理模型請(qǐng)求參數(shù)變多,我們對(duì)CPU性能和內(nèi)網(wǎng)帶寬要求更高,倚天710云實(shí)例很好地滿(mǎn)足了我們業(yè)務(wù)升級(jí)的需求,實(shí)現(xiàn)了降本與增效。”據(jù)悉,其在引入倚天710云實(shí)例后,CPU性能和內(nèi)網(wǎng)帶寬均實(shí)現(xiàn)提升,綜合性?xún)r(jià)比提升40%以上。
在去年10月的2021阿里云棲大會(huì)上,倚天710正式推出,這是阿里第一顆為云而生的CPU,使阿里成為繼亞馬遜、華為后,全球第三家擁有自研Arm服務(wù)器芯片的云計(jì)算廠(chǎng)商。
倚天710單片容納高達(dá)600億個(gè)晶體管,在全球權(quán)威CPU基準(zhǔn)測(cè)試集SPECint2017上,倚天710的分?jǐn)?shù)達(dá)到440,超出業(yè)界標(biāo)桿20%,能效比優(yōu)于業(yè)界標(biāo)桿50%以上,能有效幫助數(shù)據(jù)中心節(jié)能減排。
在倚天710推出不久后的2021年“天貓雙11”,技術(shù)立馬遭遇極限考驗(yàn)。
眾所周知,“天貓雙11”創(chuàng)造了全社會(huì)一年的流量高峰,高并發(fā)對(duì)算力的性能、穩(wěn)定性要求極高。阿里將淘寶核心交易系統(tǒng)遷移至基于倚天710的實(shí)例,根據(jù)其官方數(shù)據(jù),這一替換使得算力性?xún)r(jià)比提升了30%。
電商業(yè)務(wù)的應(yīng)用只是一個(gè)開(kāi)始。阿里在全球管理著超過(guò)150萬(wàn)臺(tái)服務(wù)器,隨著自研CPU的誕生,其已在阿里數(shù)據(jù)中心規(guī)?;渴穑M(jìn)而支持存儲(chǔ)、數(shù)據(jù)庫(kù)、大數(shù)據(jù)、視頻云等多個(gè)行業(yè)。
今年,倚天710的落地步伐加快,通過(guò)阿里云輸出,倚天710提供的算力也從內(nèi)部走向了外部各行各業(yè)。據(jù)稱(chēng),中國(guó)一些知名的科學(xué)計(jì)算、智能手機(jī)行業(yè)和互聯(lián)網(wǎng)等領(lǐng)域的企業(yè)在遷移至倚天710云實(shí)例后,性?xún)r(jià)比均得到了顯著提升。
這意味著倚天真正成為中國(guó)首個(gè)云上大規(guī)模應(yīng)用的自研CPU,倚天710不僅能用,而且好用。
攻克落地難題,芯云融合潛力巨大
倚天710的成功絕不輕易。
當(dāng)下,科技企業(yè)涌入硬件創(chuàng)新賽道漸成趨勢(shì),但選擇征戰(zhàn)通用處理器技術(shù)的玩家屈指可數(shù)。
近年來(lái),Arm陣營(yíng)在英特爾、AMD主導(dǎo)的x86服務(wù)器市場(chǎng)劃開(kāi)了一道口子。Arm于2018年推出了專(zhuān)為云數(shù)據(jù)中心打造的服務(wù)器處理器,而基于Arm架構(gòu),目前只有亞馬遜等幾家大公司及少數(shù)獨(dú)立CPU公司推出了頂級(jí)性能的云端通用處理器。
研發(fā)一顆高性能的通用服務(wù)器芯片本身就極具技術(shù)挑戰(zhàn),但這僅僅是系列挑戰(zhàn)的開(kāi)始。要真正實(shí)現(xiàn)芯片的大規(guī)模應(yīng)用落地,還要克服眾多技術(shù)難題。
在這個(gè)過(guò)程中,技術(shù)團(tuán)隊(duì)需要針對(duì)場(chǎng)景做深度優(yōu)化,讓其適配不同的軟件及應(yīng)用生態(tài)。比如,需要提供多語(yǔ)言和多操作系統(tǒng)遷移工具,并且“打樣”最佳實(shí)踐,讓用戶(hù)愿意嘗試,以最小的工作量完成遷移適配。
阿里技術(shù)團(tuán)隊(duì)在操作系統(tǒng)層面做了大量?jī)?yōu)化,完成主流業(yè)務(wù)關(guān)鍵組件的完全適配,用戶(hù)進(jìn)行業(yè)務(wù)遷移需要改動(dòng)的代碼量是——0。
能做到這樣的極致效果,背后是倚天710為云而生的設(shè)計(jì)理念。為云而生,當(dāng)然更易被云所用。
云場(chǎng)景經(jīng)常有高并發(fā)、高性能和高能效的算力需求,因此倚天710被設(shè)計(jì)成可提供極致物理核性能的處理器,并且通過(guò)單個(gè)物理核獨(dú)享緩存,有效提升性能穩(wěn)定性和可預(yù)期度,讓使用倚天710云實(shí)例的計(jì)算服務(wù),能持續(xù)輸出更穩(wěn)定算力。
生于云、用于云,倚天710云實(shí)例的大規(guī)模應(yīng)用,證明了阿里所選擇的這條芯云深度融合的算力攻堅(jiān)之路,走得通,行得遠(yuǎn)。
算力升維賽打響,阿里亮出新王牌
知名行研機(jī)構(gòu)IDC預(yù)測(cè),未來(lái)五年全球算力規(guī)模增速將超50%,到2025年整體達(dá)到3300EFlops(每秒33萬(wàn)億億次浮點(diǎn)運(yùn)算)。
算力需求的爆發(fā),對(duì)技術(shù)提出更高挑戰(zhàn)。
回顧現(xiàn)代算力產(chǎn)業(yè)發(fā)展歷程,從大型機(jī)、小型機(jī)、PC、移動(dòng)終端到云計(jì)算,背后,人們對(duì)算力的需求也從早期僅需發(fā)個(gè)信息,變?yōu)榘l(fā)圖文、看視頻、實(shí)時(shí)通話(huà)等。在可以預(yù)見(jiàn)的未來(lái),自動(dòng)駕駛、元宇宙、人工智能需求將推動(dòng)新一波算力升維賽。
算力產(chǎn)業(yè)正進(jìn)入一個(gè)軟件定義、硬件加速的新階段。這場(chǎng)算力升維賽,既比拼從底層硬件到上層IaaS、PaaS、SaaS的數(shù)據(jù)傳輸和計(jì)算效率,又比拼云與大量和多樣化的邊緣、端側(cè)的協(xié)同融合能力。
面向這一趨勢(shì),從本次阿里云棲大會(huì)我們看到,阿里的新王牌,正是“飛天+CIPU+倚天710”驅(qū)動(dòng)的一個(gè)全新的計(jì)算體系。
追溯整個(gè)體系的起點(diǎn),還要從2009年飛天的第一行代碼說(shuō)起。
彼時(shí),國(guó)內(nèi)依舊沒(méi)有自己的算力系統(tǒng),IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫(kù)、EMC存儲(chǔ))架構(gòu)下企業(yè)只能不斷擴(kuò)大采購(gòu)規(guī)模。飛天的誕生讓算力成為一種可在線(xiàn)獲取的資源,分布式替代了傳統(tǒng)集中式架構(gòu),也從而拉開(kāi)了中國(guó)企業(yè)自研云計(jì)算的序幕。
2013年,飛天調(diào)度的服務(wù)器數(shù)量突破5000臺(tái)大關(guān),標(biāo)志著早期的算力底座正式落成?;诖?,阿里云成功應(yīng)對(duì)十多年“雙11”和“12306”春運(yùn)購(gòu)票等極限并發(fā)場(chǎng)景挑戰(zhàn),不斷拓展云計(jì)算的性能邊界,連續(xù)多年穩(wěn)居亞太第一、全球前三。
隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,企業(yè)對(duì)上云提出了強(qiáng)算力、低時(shí)延、高帶寬的新需求,僅靠軟件及系統(tǒng)層面的優(yōu)化已無(wú)法滿(mǎn)足。因此,阿里開(kāi)始深入硬件,從神龍到CIPU,完成系列突破。
CIPU發(fā)布于2021年6月,是為阿里云飛天操作系統(tǒng)設(shè)計(jì)的專(zhuān)用處理器。CIPU相當(dāng)于是云計(jì)算的CPU,在上面跑的是飛天云操作系統(tǒng),進(jìn)而形成了云上的統(tǒng)一虛擬資源池,并供客戶(hù)使用云上算力。無(wú)論是分布式應(yīng)用還是AI場(chǎng)景測(cè)試中,“CIPU+飛天”都展現(xiàn)出了更優(yōu)越的性能。
今天,倚天710云實(shí)例再次升級(jí)“CIPU+飛天”,通過(guò)芯片、操作系統(tǒng)、計(jì)算架構(gòu)以及上層應(yīng)用的協(xié)同優(yōu)化,云計(jì)算的整體性能和性?xún)r(jià)比均得到大幅提升。
算力攻堅(jiān)13年,阿里已成長(zhǎng)為實(shí)打?qū)嵉挠部萍脊?。張建鋒說(shuō),阿里云將堅(jiān)持技術(shù)長(zhǎng)征,面向下一代體系去構(gòu)建第二技術(shù)曲線(xiàn),抓住未來(lái)技術(shù)的定義權(quán)。