最近,龍芯 3A5000 成功流片,飛騰發(fā)布了 D2000 和 S2500,兆芯 KH-40000 即將流片,SW3232 流片成功,SW432 正在時(shí)序優(yōu)化和正確性驗(yàn)證中。由于國產(chǎn) CPU 眾多,比較是再所難免的,鐵流簡單做一個(gè)盤點(diǎn)。由于各家 CPU 的核心數(shù)不一樣,有的 64 核,有的 4 核、8 核,因而鐵流就以對用戶體驗(yàn)影響最大的單核性能為標(biāo)尺進(jìn)行對比。
龍芯
龍芯最新一代的 CPU 是 3A5000,這款處理器使用 14/16nm 工藝,微結(jié)構(gòu)在 4000 的基礎(chǔ)上進(jìn)行小改,可以視為 3A4000 提升工藝版本。龍芯 3A4000 采用 GCC 編譯器,SPEC20006 定點(diǎn)和浮點(diǎn)成績都在 20 左右(@2G 主頻),3A5000 猜測主頻在 2.5G 左右,單核性能估算 25 至 28。由于 3A5000 已經(jīng)完成流片,是成品,而非期貨。3A5000 有望在一段時(shí)間內(nèi)成為 XC 市場最好的 CPU。根據(jù)龍芯官方的說法,2020 年 2 季度后流片的 CPU 均支持 Loongarch。3A5000 很可能是龍芯第一款支持 Loongarch 的 CPU。
龍芯的桌面 CPU 做的非常不錯(cuò),但在服務(wù)器 CPU 上由于核數(shù)較少,暫時(shí)落后于國產(chǎn) X86 和 ARM CPU。龍芯的服務(wù)器 CPU 要等 3C5000 了。
申威
SW 由相關(guān)單位設(shè)計(jì),在超算上非常成功,神威太湖之光曾經(jīng)多次在 TOP500 上名列第一,即便現(xiàn)在依然位居第三。在超算上取得成功后,SW 開始把服務(wù)器作為發(fā)力的方向,2019 年會(huì)有 SW3231 問世,2020 年 SW3232 已經(jīng)流片成功,性能基本達(dá)到預(yù)期,主頻在 2.4G 左右,鐵流估算 SW3232 單核 25 分以上,SW432 正在時(shí)序優(yōu)化和正確性驗(yàn)證中,可以視為 SW3232 的四核桌面版本。
SW3232 在單核與多核性能上著實(shí)不俗,申威用實(shí)踐證明,獨(dú)立自主與 CPU 高性能可以兼得,沒必要一定依附于 X86 和 ARM,中國人自主定義指令集完全走的通。
飛騰
12 月 29 日,飛騰發(fā)布了 D2000 和 S2500。D2000 集成了 8 個(gè) FTC663,主頻 2.3-2.6GHz,典型功耗 25W,就主頻而言,D2000 相對于 FT-2000/4 是退步的。D2000 其實(shí)就是 FT-2000/4 采用境內(nèi) 14nm 工藝的 8 核版本,S2500 則是 FT-2000/64 的境內(nèi) 14nm 工藝版本。
根據(jù)飛騰的官方介紹,F(xiàn)T-2000/4 集成 4 個(gè) FTC663,16nm 制程,主頻 2.6 至 3.0GHz,最大功耗 10W,單核 1GHz 下芯片功耗降為 3.8W。在專業(yè) CPU 性能測試軟件 SPEC2006 中,F(xiàn)T-2000/4 全芯片實(shí)測整數(shù)計(jì)算得分 61.1,浮點(diǎn)計(jì)算得分 62.5(3Ghz)。
據(jù)相關(guān)單位測試,2.6G 主頻的 FT-2000/4 單核性能大約為 16.5(定點(diǎn)),那么,D2000 的單核性能估算是 14.6(2.3Ghz)至 16.5(2.6Ghz)。
之所以主頻退步,鐵流猜測是境內(nèi) 14nm 工藝和臺(tái)積電工藝有差距,臺(tái)積電代工主頻可以到 2.6 至 3.0GHz,境內(nèi)晶圓廠只能到 2.3-2.6GHz。類似的 FT2000/64 采用臺(tái)積電工藝主頻可以到 2.4Ghz,而 S2500 采用境內(nèi)工藝主頻只有 2.1Ghz。采用境內(nèi)工藝的好處是拓寬流片渠道,降低制造環(huán)節(jié)的安全風(fēng)險(xiǎn),不過,由于境內(nèi)晶圓廠在設(shè)備、材料等方面對外商有依賴,一旦美國下禁令,D2000 和 S2500 會(huì)步麒麟后塵,瞬間絕版。
根據(jù)竇強(qiáng)博士的 PPT,飛騰下一代 FTC860 單核性能 SPEC06 提升 50%,大于 25 分。不過,F(xiàn)TC860 還是 PPT,是期貨。
兆芯
兆芯最新的 KX6000,把主頻做到 2.7G 至 3.0G。根據(jù)兆芯公布的 PPT,SPECint2006 有 29 分(ICC 編譯器),如果采用 GCC 編譯器的話,成績要打一個(gè)折扣,3G 主頻下估計(jì) 20 分的成績應(yīng)該還是有的。KX6000 的單核性能基本達(dá)到了老一代 AMD 處理器(推土機(jī)、挖掘機(jī))的水平。
據(jù)小道消息,KH-40000 對標(biāo)海光 7 系、5 系、3 系,KH-40000(32 核)spec 2006 可達(dá) 1000 分+(ICC),相應(yīng)的桌面版本 KX7000 在 2021 年流片。KH-40000 和上一代產(chǎn)品都采用 16nm 工藝,新架構(gòu)單核心 CPU spec 跑分提升 60%。參考 KX6000 單核 20 分的成績,KH-40000 及其桌面版 KX7000 的單核成績估算為 25+。
CPU 單核性能匯總
KP 因?yàn)榕_(tái)積電斷供而絕版,就不列入表格了。
從上圖可以看出,國產(chǎn) CPU 單核性能基本都達(dá)到了 25 分這道坎,國產(chǎn) CPU 的進(jìn)步是顯而易見的。
在看到成績的同時(shí),也要看到差距。就單核性能來說,目前英特爾主流 CPU 普遍在 40 至 50+,追趕之路任重道遠(yuǎn)。