隨著人工智能技術的飛速發(fā)展,算力已成為推動產業(yè)變革的關鍵力量,但大模型的快速發(fā)展,參數的爆發(fā),對于算力需求也提出了更高的要求,帶來了全新的挑戰(zhàn)。那大算力芯片應對這些挑戰(zhàn),如何才能夠助力人工智能技術的發(fā)展,實現(xiàn)算力的落地和最后一公里的打通?
2024年7月8日,億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士在“2024算力技術創(chuàng)新發(fā)展生態(tài)大會”上發(fā)表了題為《超越極限:大算力芯片面臨的技術挑戰(zhàn)和解決策略》的主題演講,從億鑄自己的角度帶來了大算力時代下新的解決方案。
打通最后一公里,算力落地帶來無限可能
人工智能正與傳統(tǒng)行業(yè)深度融合,創(chuàng)造出智算中心、AI PC、AI手機和具身智能等新型產品與服務,使得這些傳統(tǒng)產業(yè)在AI的影響下變得更加智能化和個性化,從而提供更加精準和高效的服務,這也是算力落地的最后一步。
以智算中心為例,據《中國算力發(fā)展指數白皮書》顯示,2022年中國智能算力規(guī)模達到178.5 EFlops,年增長率為71.63%。預計到2026年,中國的AI算力規(guī)模將達到1271.4 EFLOPS。在端側也是如此,以具身智能為例,具身智能是將人工智能與機器人的感知等能力相結合,使機器人能夠以更智能和自然的方式,完成工業(yè)和服務應用場景中不同的任務,未來將有極大的發(fā)展空間。
但是熊大鵬博士也指出,要打通最后一公里,實現(xiàn)算力的落地,對芯片也提出了完全不同的要求。目前傳統(tǒng)架構下的大算力芯片主要面臨著存儲墻,能耗墻等諸多問題,不同的公司都在尋找解決路徑。
大算力芯片面臨哪些挑戰(zhàn)
對于具體的挑戰(zhàn)及問題,熊大鵬博士從有效算力的第一性原理的角度對相關問題做了闡釋:
對于傳統(tǒng)的馮諾依曼架構而言,數據搬運和訪存占據了大量時間,形成了存儲墻及其有效性能的天花板。其中,存儲墻問題對AI的發(fā)展構成了重大挑戰(zhàn),過去20年峰值算力提高了90000倍,但內存帶寬僅提高了100倍,互聯(lián)帶寬僅提高了30倍??梢哉f帶寬的發(fā)展速度嚴重滯后于算力的發(fā)展速度,已成為嚴重制約AI發(fā)展的關鍵所在。除了芯片內部的數據傳輸,芯片與芯片間的傳輸也遇到了瓶頸。隨著AIGC浪潮興起,AI服務器需求增長,服務器內部之間或與其他設備的數據傳輸、控制和管理等接口功能的要求也隨之增加。
同時, 隨著人工智能模型的規(guī)模和復雜性不斷增加,在訓練和運行時所需的能源消耗也在顯著增長。為了應對能源挑戰(zhàn),人工智能行業(yè)需要開發(fā)更高效的算法和硬件,以減少能源消耗。
由于存儲墻和能耗墻的存在,未來想要實現(xiàn)更高的算力,就需要消耗更多的芯片,更多的互聯(lián)技術和更多的能耗,隨之而來的就是在傳統(tǒng)架構的基礎上無論是電力的成本還是設施建設的成本,都呈現(xiàn)爆發(fā)式的增長。
那么該如何解決上述的問題呢?目前業(yè)界已經有很多公司在嘗試新的路徑,而億鑄科技則堅定的從存算一體的角度尋找"終極解決方案"。
算力落地的終極解決方案
眾所周知,摩爾定律曾是半導體行業(yè)發(fā)展的黃金法則,它預言了集成電路上晶體管的數量將每兩年翻一番,從而實現(xiàn)性能的指數級增長。然而,隨著工藝節(jié)點的不斷微縮,晶體管尺寸已接近物理極限,導致摩爾定律面臨局限,業(yè)界一直在尋找新的解決方案。
存算一體技術有望成為后摩爾時代的重要技術路線之一,它不僅能夠解決當前工藝制程面臨的挑戰(zhàn),還能夠為計算領域帶來新的增長點。存算一體將存儲和計算有機結合,理論上計算可以直接在存儲器中進行,這樣既打破了系統(tǒng)對于存儲器的絕對依賴,還能夠極大地消除數據搬移帶來的開銷,徹底消除“存儲墻”以及“能耗墻”的問題。
最后,熊大鵬博士指出,從有效算力的第一性原理來看,對于存算一體,數據搬運量大幅下降,有效算力呈現(xiàn)線性增長??梢哉f存算一體將打破摩爾定律,開啟算力第二增長曲線。同時,相信存算一體技術在未來計算領域的變革性潛力,特別是在AI時代,這種技術可能會成為推動算力增長的關鍵因素。
億鑄科技的創(chuàng)新不僅為大算力芯片的發(fā)展提供了新思路,更為人工智能技術的進一步發(fā)展奠定了基礎。隨著存算一體架構的不斷成熟和應用,我們有理由相信,億鑄科技將在人工智能的新紀元中扮演重要角色。
未來,億鑄科技將以創(chuàng)新驅動未來,與全球伙伴共同開啟人工智能的新篇章。我們期待與各界同仁攜手合作,共創(chuàng)智能科技的美好未來。