好家伙,只能說好家伙。都2024年了,SRAM概念居然能成為風口屬實沒有想到!
今天芯片圈有個爆炸性的消息,叫大模型推理最快芯片出世,創(chuàng)始人喊話奧特曼,你們太慢了!
這家初創(chuàng)公司叫Groq,原來谷歌TPU的人馬,自研芯片主要是加速推理卡那種。
按他們的說法,他們的推理速度比英偉達的GPU快了十倍!但是成本卻只有十分之一,那一來一去豈不是差百倍?
看起來非常棒!
目前Groq公司的新款加速卡,可以支持Mixtral?8x7B SMoE,LIama 2的7B和70B這三種模型,并且可以直接體驗Demo。
目前測試下來效果接近每秒500tokens,當然他們只說快,沒說內(nèi)容真實性和準確性,內(nèi)容概不負責的那種。
除了Demo演示,Groq現(xiàn)在也支持APi訪問,并且完全兼容,可以直接從OpenAI的APi切換。
免費十天,一共100萬tokens可以用。
價格方面也表示,未來肯定低于市面上同類價格。
總之,看起來非常棒!
本來呢,這就是國外初創(chuàng)公司新產(chǎn)品自我宣傳,自我展示的過程,和國內(nèi)沒有半毛錢關系。
但是國內(nèi)突然有一個板塊跟打了雞血一樣猛干猛干。
我一看原來是SRAM芯片板塊,好幾個股票都直接被干上20cm,我去。
擦,我仔細去看了一下,原來是Groq表示該新產(chǎn)品采用14nm制程,搭載了230M的SRAM來保證帶寬,片上系統(tǒng)內(nèi)存帶寬達到了80TB/s。
然后國內(nèi)這些小作文手,居然開始狂吹SRAM,說什么拳打DRAM,腳踢HBM。
好家伙,是真當行業(yè)里沒人懂是吧。
科普一下SRAM是什么芯片
SRAM的中文全名叫靜態(tài)隨機存取存儲器,和DRAM也就是內(nèi)存,技術(shù)上略有不同。
SRAM是易失性內(nèi)存,也就是說斷電不保存數(shù)據(jù),這點DRAM內(nèi)存條也一樣,NAND FLASH剛好相反,它是非易失性的,斷電還能保存數(shù)據(jù)。
SRAM的優(yōu)點很明顯,快,非常快,不僅遠遠超過NAND,更是超過DRAM的速度,所以SRAM特點就是快。
你可以理解成SRAM一個高速搬運的臨時倉庫,DRAM是次一級稍微慢一點的臨時倉庫,NAND是一個比較慢的永久倉庫。
三者共同組成了計算機的存儲架構(gòu),嚴格意義上來講,SRAM+DRAM叫內(nèi)存,NAND以及過去的HDD機械硬盤叫外存。
而前端時間炒火熱的HBM高帶寬內(nèi)存,實際上是DRAM的超級加強版,它的本質(zhì)是通過堆疊多顆DRAM的芯片來提供更高的帶寬和容量。
歷史上,SRAM作為單獨一個顆芯片存在是有過一段歷史期的。
但是到80年后,90年初基本就消失淘汰了,現(xiàn)在只有在極少數(shù),特俗的應用場合才能看到它。比如128M,256M的產(chǎn)品依然有,甚至還有512M。干嘛呢?新款芯片測試和研發(fā)的時候搭載一個SRAM,主要就是研發(fā)測試用,談不上商業(yè)化,市場化。
80年代初,如夢初醒的歐洲人在半導體領域為了不被發(fā)展強勁的美日兩國拉開差距,歐洲共同體曾經(jīng)搞過一個叫“尤里卡計劃”,這個計劃里有個關于集成電路的項目叫JESSI。
JESSI里面最重要的項目就是MEGA,對,就叫這個名字,和理想汽車MEGA沒關系。
這個計劃就是做1M的內(nèi)存,MEGA項目有兩個具體執(zhí)行的單位,分別是西門子和飛利浦。
于是兩家公司分工了一下,西門子負責DRAM,飛利浦負責SRAM。
西門子的DRAM事業(yè)就是從這里起步,后面2006年的時候DRAM事業(yè)拆分就是奇夢達,然后經(jīng)歷了2008年金融危機,以及同行三星瘋狂價格戰(zhàn)后,奇夢達最終倒在了2009年,之后奇夢達的專利又被老朱同志搞來,于是就有了國產(chǎn)內(nèi)存之光——長鑫!
國產(chǎn)內(nèi)存,國貨之光!
這段歷史在我內(nèi)存戰(zhàn)爭里都講過。
項目在1984年啟動,兩個巨頭準備出資15億馬克,兩國政府補貼5億馬克,目標是在80年代末趕上日本人。
做到一半的時候,西門子在最關鍵的時候選擇“背刺”,他們直接從東芝引進DRAM的技術(shù)!并且在1987年的時候順利量產(chǎn)了1M的DRAM。
正是因為這個原因,西門子直接從日本復制了整個東芝生產(chǎn)線的設備,當然光刻機也肯定用了尼康的。
然后歐洲的光刻機初創(chuàng)公司ASML當時就哭了,說好的是歐洲政府補貼的項目,怎么好處全給日本同行???
好在,ASML還有飛利浦這個好爸爸,最艱苦的時候,ASML依靠爸爸,稍微賣了幾臺光刻機,熬了過去。
但是問題又來了,隨著市場變化和技術(shù)迭代,SRAM芯片市場逐漸消失。甚至CPU大哥英特爾直接把它集成到CPU里面變成緩存,單顆的SRAM芯片還有誰要???
所以,最終飛利浦負責SRAM項目失敗了,落得一地雞毛。
思來想去,飛利浦只能選擇止損。
他們找到當時剛剛對新技術(shù)饑渴難耐的中國臺灣,因為那邊剛剛誕生了未來的芯片代工巨頭——臺積電!
于是飛利浦毫無保留的把整個MEGA項目的生產(chǎn)線放開給臺積電學習,再原封不動的把所有設備打包搬到中國臺灣,當然作為光刻機供應商的ASML,也總算順帶把自己的光刻機設備給賣出去了。
作為回報,在臺積電股東里,飛利浦是當時最大的外部股東,占股27.5%。
所以說臺積電的老底子都是飛利浦給打下來的。
最意思的事來了!
1988年,新產(chǎn)線快弄好的時候發(fā)生了一場大火,無奈之下,臺積電只能把所有過火的光刻機退了回去,并且重新下了17臺新訂單。
這17臺機器的訂單是真的幫了大忙!
ASML當時很缺錢,這些訂單在關鍵時刻救了急。當然FAB都有保險,結(jié)果就是為火災埋單的保險公司成了ASML的客戶,所以1989年的時候,從嚴格意義上講,ASML最大的客戶是保險公司?。?!
從上面這個小故事大家就可以看到,到80年代后90年代初,SRAM基本作為單獨芯片銷售的市場基本上已經(jīng)消失了。
當然,SRAM并沒有消失,它們以IP內(nèi)核的形式直接被集成到CPU,GPU,以及各種SoC芯片內(nèi)部。
直接設計在一起,然后流片流出來就行了,沒什么人買單顆SRAM的芯片了!除了上文提到過的極少數(shù)的需求之外。
到現(xiàn)在CPU,GPU的內(nèi)部都有SRAM,它們作為芯片的二級緩存而普遍存在。
在PC,HPC上的CPU里面,SRAM面積還不小哦,普遍占到一半,但是在手機這種對功耗要求比較高的CPU里,SRAM就比較小了。
由此可見,SRAM還有兩個特點,第一是面積大,第二是功耗高。
SRAM和DRAM相比,面積上天然劣勢,這個沒辦法,因為本身結(jié)構(gòu)限制了。
DRAM的原理是1T1C,也就是一個電容一個晶體管,而SRAM則由6個晶體管組成。
因此同容量情況下,SRAM的面積得是DRAM的5,6倍以上。
而面積就是成本,所以SRAM按單位面積算,那是相當昂貴的!
所以CPU,GPU里能給的容量,普遍也就幾M到幾十M,比如啟哥這顆i9-14900的CPU頂配桌面級CPU,當時4000多大洋買的,SRAM二級緩存只有區(qū)區(qū)32M。
不是英特爾不想做大,而是真的用不起??!
商業(yè)環(huán)境下,你不能只考慮性能,不考慮成本,你說是不是?
當然在AI芯片上,情況略有不同,畢竟AI芯片的核心面積比我的i9要大多了,所以普遍能上100多,甚至200多M的SRAM緩存。
畢竟人家Qroq的一塊卡,要賣2萬多美金,那用料必須得足啊,速度必須得快啊,否則對不起這2萬美金的售價?。?/p>
那再反過來說,就算以后大容量的SRAM成為AI芯片的標準,請問和國內(nèi)做SRAM上市公司有什么關系嗎?
半毛錢關系都沒有!
我已經(jīng)說了,SRAM早就以IP內(nèi)核的形式集成到SoC里面,又不是單獨拿來賣的,難道Qroq還采用了國產(chǎn)SRAM公司的IP不成?
就算用了,這買IP也花不了太多錢啊!都是非常成熟的技術(shù)和方案,花不了幾個錢的!也不知道那些按計算器拍業(yè)績的人,是咋按的,反正我看不懂。
所以網(wǎng)上傳的哪份《SRAM和DRAM,從成本角度與AI的關系》,絕對有失偏頗,只提優(yōu)點,不提缺點,也不提實際情況。
實際情況就是大容量的SRAM要上,畢竟這個直接提升性能比較明顯,但是HBM也絕對不是它的對立面啊。HBM依然是未來主要技術(shù)路徑,這個毫無疑問,畢竟HBM雖然貴,但是比單位容量價格比SRAM還是便宜太多了,性價比擺著呢!
說什么SRAM未來替代HBM,絕對胡說八道!瞎扯淡!
當然了,這些半導體知識太專業(yè)了,一般人接觸不到,也不懂,哪怕是機構(gòu)研究員估計相當一部分人也稀里糊涂的,反正跟風推票完事,回頭拿派點,豈不是喜滋滋?
但是我今天偏要把這些東西給你點破,說透!
最后有人說,啟哥,你太壞了,你不點破,明天繼續(xù)漲一把,大家都賺錢不就挺好的?干嘛非要說這么清楚?萬一明天又跌回去了,看我不拿板磚拍死你!讓你丫的多嘴!
我:玩過桌游馬尼拉船長沒有,不給我上船,我TM就是要搞你們心態(tài)?。ㄊ謩庸奉^)
桌游馬尼拉船長,我好想玩??!啊啊啊啊啊啊……