人工智能(AI)應(yīng)用的興起,帶動(dòng)了高效能運(yùn)算的發(fā)展。為了應(yīng)付極為繁重的運(yùn)算任務(wù),處理器、微控制器(MCU)業(yè)者,不是推出運(yùn)算效能更高的新產(chǎn)品,就是推出了內(nèi)建專用加速單元的解決方案,來(lái)提升運(yùn)算單元處理AI運(yùn)算的效率。
但運(yùn)算單元的效能提升,只解決了部分問(wèn)題。在運(yùn)算效能大幅提升的情況下,記憶體成為運(yùn)算效能的瓶頸所在。如何用更低的成本來(lái)儲(chǔ)存大量資料,并將這些資料即時(shí)傳輸?shù)竭\(yùn)算單元進(jìn)行處理,成為記憶體必須克服的挑戰(zhàn)。
四大次世代記憶體各有挑戰(zhàn)
成功大學(xué)電機(jī)系副教授盧達(dá)生指出,在高速運(yùn)算領(lǐng)域,記憶體面臨這三個(gè)主要的挑戰(zhàn),分別是如何提高儲(chǔ)存密度、如何提高資料傳輸效能,以及降低功耗。在提高儲(chǔ)存密度方面,記憶體業(yè)界已普遍導(dǎo)入3D堆疊架構(gòu),來(lái)提升資料儲(chǔ)存的密度;在性能方面,則發(fā)展出高頻寬記憶體,來(lái)解決馮紐曼運(yùn)算架構(gòu)的瓶頸。嵌入式記憶體則是頻寬與功耗問(wèn)題的解答,藉由縮短處理器與記憶體之間的實(shí)體距離,記憶體與處理器之間的通訊頻寬得以提高,資料傳輸?shù)墓囊泊蠓纳啤?/p>
然而,現(xiàn)有的記憶體技術(shù)存在許多限制。例如SRAM雖然有極低的延遲,而且理論上沒(méi)有讀寫次數(shù)的限制,但其占用的面積相當(dāng)大,而且斷電后儲(chǔ)存在上面的資料也會(huì)遺失;快閃記憶體可以實(shí)現(xiàn)相當(dāng)高的儲(chǔ)存密度,但讀寫次數(shù)有限,而且寫入資料的速度慢,功耗也高。
為突破現(xiàn)有記憶體技術(shù)的限制,產(chǎn)業(yè)界與學(xué)術(shù)界一直在研究新的記憶體技術(shù)。目前最具潛力的次世代記憶體技術(shù)有四種,分別是相變記憶體(PCM)、磁性記憶體(MRAM)、電阻記憶體(RRAM),以及鐵電記憶體(FeRAM)。這些記憶體技術(shù)都具有比快閃記憶體更高的寫入速度與更低的功耗,密度也比SRAM更高,同時(shí)都具有非易失性,斷電后資料也不會(huì)遺失。
但這些新興記憶體技術(shù)本身也有許多需要克服的問(wèn)題。以相變記憶體來(lái)說(shuō),因?yàn)槠湫枰喈?dāng)大的電流來(lái)重置記憶單元,因此其功耗跟讀寫速度,僅略優(yōu)或相當(dāng)于快閃記憶體。磁性記憶體的問(wèn)題則是在量產(chǎn)方面,特別是基于自旋電子的Spin Torque Transfer MRAM(STT-MRAM),因?yàn)樾枰珳?zhǔn)堆疊數(shù)十層厚度不到1奈米的薄膜,使其生產(chǎn)製程變得非常困難。
電阻記憶體的挑戰(zhàn)之處則在于其所使用的材料電阻值變化范圍相當(dāng)大,固有雜訊(Inhernet Noise)的水準(zhǔn)也高。此外,電阻記憶體的讀寫次數(shù)限制也僅略優(yōu)于快閃記憶體。鐵電記憶體的最大問(wèn)題,則是高溫環(huán)境下的穩(wěn)定度仍有疑慮。各種記憶體技術(shù)的關(guān)鍵性能指標(biāo)整理如表1。
由于盧達(dá)生所率領(lǐng)的研究團(tuán)隊(duì),主要進(jìn)行鐵電記憶體技術(shù)相關(guān)的研究,因此盧達(dá)生也特別分享了跟鐵電記憶體有關(guān)的最新進(jìn)展。
盧達(dá)生指出,鐵電記憶體的商品化其實(shí)非常早,例如日本地鐵系統(tǒng)所使用的西瓜卡(Suica),早期版本所使用的記憶體就是鐵電記憶體;Sony所推出的Felica智慧卡,也是使用鐵電記憶體。日本廠商選用鐵電記憶體的原因,主要是看上了鐵電記憶體的超低功耗特性,而且在這類應(yīng)用中,基本上不存在高溫的問(wèn)題,所以應(yīng)用開發(fā)商可以放心使用。
但早期鐵電記憶體所使用的材料,是無(wú)法跟CMOS製程相容的。這項(xiàng)限制對(duì)鐵電記憶體的發(fā)展,產(chǎn)生了很大的影響。直到最近,學(xué)界才發(fā)現(xiàn)了可以與CMOS製程相容的新一代鐵電材料,讓鐵電記憶體可望成為嵌入式記憶體的一種。但鐵電記憶體對(duì)溫度變化過(guò)于敏感,更害怕高溫環(huán)境的問(wèn)題,目前仍未取得重大突破。
MRAM商品化/技術(shù)研發(fā)兩頭并進(jìn)
專精于磁性記憶體研究的陽(yáng)明交通大學(xué)半導(dǎo)體學(xué)院特聘教授曾院介則進(jìn)一步分析,磁性穿隧接面(MTJ)是磁性記憶體的核心。在STT-MRAM(圖1)這種架構(gòu)中,虛線框內(nèi)由兩層鈷鐵硼(CoFeB)夾著氧化鎂(MgO)的結(jié)構(gòu),就是STT-MRAM的MTJ。這個(gè)三明治結(jié)構(gòu)必須做得非常完美,MTJ才能正常運(yùn)作。這對(duì)于蝕刻跟圖案化製程來(lái)說(shuō),是相當(dāng)大的挑戰(zhàn)。
圖1 STT-MRAM結(jié)構(gòu)
除了MTJ之外,從圖2也可以看出,在一個(gè)STT-MRAM Cell 的兩個(gè)電極之間,必須堆疊十多層由不同材料構(gòu)成的薄膜,且每一層薄膜的厚度都不到于1奈米。這對(duì)于量產(chǎn)來(lái)說(shuō),也是相當(dāng)大的考驗(yàn)。
圖2 STT-MRAM與SOT-MRAM的結(jié)構(gòu)與特性比較
除了STT-MRAM之外,自旋軌道扭矩磁性記憶體(SOT-MRAM)也是一種備受矚目的技術(shù)。與STT-MRAM相比,SOT-MRAM的密度雖然比較低,但卻具有更省電、更可靠且讀寫速度更快的優(yōu)勢(shì),因此成為臺(tái)積電與三星(Samsung)競(jìng)相投入的新一代MRAM技術(shù)。圖2為STT-MRAM與SOT-MRAM的比較。
以商品化的進(jìn)程來(lái)看,目前STT-MRAM已經(jīng)可以量產(chǎn),SOT-MRAM則仍在研發(fā)階段。但由于STT-MRAM製程難度非常高,因此市場(chǎng)上的供應(yīng)商極為有限,Everspin就是其中的代表性廠商之一。
Everspin亞太/日本區(qū)應(yīng)用工程師張紘偉指出,STT-MRAM是一種極具發(fā)展?jié)摿Φ募夹g(shù),過(guò)去數(shù)十年來(lái)一直有廠商想進(jìn)入這個(gè)市場(chǎng),有像Everspin這種提供獨(dú)立元件的廠商,也有晶圓代工廠想將MRAM當(dāng)作一種嵌入式記憶體來(lái)使用。
但誠(chéng)如陽(yáng)明交大曾院介教授所言,MRAM的結(jié)構(gòu)十分複雜,對(duì)製程的要求又高,如果真的要按照實(shí)驗(yàn)室標(biāo)準(zhǔn)來(lái)生產(chǎn)STT-MRAM,會(huì)遇到相當(dāng)多困難。因此,Everspin的STT-MRAM在設(shè)計(jì)上做了一定程度的改變,以提高STT-MRAM元件的可量產(chǎn)性。
但即便如此,STT-MRAM 顆粒的生產(chǎn),還是有相當(dāng)高的門檻要跨越。目前市場(chǎng)上除了Everspin之外,僅Avalanche有針對(duì)商用市場(chǎng)提供產(chǎn)品。中國(guó)也有一些投入STT-MRAM的晶片公司,但他們主要是針對(duì)軍用市場(chǎng)。
其實(shí),STT-MRAM除了省電之外,強(qiáng)固性也是其主要優(yōu)勢(shì)所在。針對(duì)極端環(huán)境的工業(yè)及物聯(lián)網(wǎng)應(yīng)用,Everspin可提供操作溫度范圍在攝氏-55~125度之間, 資料維持時(shí)間長(zhǎng)達(dá)20年的元件,由此就可看出STT-MRAM的強(qiáng)固性可以做到何種水準(zhǔn)。但需要這麼高可靠度的應(yīng)用畢竟是少數(shù),為降低成本,開拓更廣泛的應(yīng)用市場(chǎng),Everspin將在下半年推出操作溫度范圍縮小到攝氏-40~85度,資料維持時(shí)間至少10年,但容量最大可達(dá)256Mb 的新產(chǎn)品線(圖3)。
圖3 Everspin即將針對(duì)更主流的工業(yè)/IoT應(yīng)用推出對(duì)應(yīng)的STT-MRAM產(chǎn)品
高速運(yùn)算為次世代記憶體帶來(lái)新契機(jī)
對(duì)于記憶體產(chǎn)業(yè)跟研究相關(guān)技術(shù)的學(xué)術(shù)研究團(tuán)隊(duì)而言,現(xiàn)有的主流記憶體技術(shù)從來(lái)就不完美,不是具有易失性,就是讀寫速度太慢,或是有次數(shù)上的限制。因此,產(chǎn)業(yè)界跟學(xué)術(shù)界在次世代記憶體研究的漫漫長(zhǎng)路上,已經(jīng)走了數(shù)十年,才漸漸有比較明確的應(yīng)用成果出現(xiàn),但也僅只于某些利基型應(yīng)用。
高速運(yùn)算的需求,很可能將成為次世代記憶體應(yīng)用發(fā)展的催化劑。記憶體內(nèi)運(yùn)算(In Memory Computing)、神經(jīng)型態(tài)運(yùn)算(Neuromorphic Computing)這些專為處理大量資料而誕生的高速運(yùn)算架構(gòu),需要將邏輯跟記憶單元做更緊密的藕合,同時(shí)也讓次世代記憶體的需求變得更加迫切。未來(lái)幾年,這些次世代記憶體的應(yīng)用發(fā)展,是否會(huì)因?yàn)楦咚龠\(yùn)算的發(fā)展而明顯加快,值得拭目以待。