作者 |??ZeR0,編輯?|??漠影
山雨欲來風(fēng)滿樓。
兼容CUDA這條路,走不通了?
芯東西3月6日消息,據(jù)外媒報道,英偉達已禁止用轉(zhuǎn)譯層在其他GPU上跑CUDA軟件。
自2021年以來,英偉達已在其在線列出的許可條款中明文禁止使用轉(zhuǎn)譯層在其他硬件平臺上運行基于CUDA的軟件。軟件工程師@Longhorn發(fā)現(xiàn)這項“禁令”已被添加到安裝CUDA 11.6及更新版本包含的最終用戶許可協(xié)議(EULA)中。
英偉達CUDA 11.6及更高版本的EULA有一條限制條款:“您不能逆向工程、反編譯或反匯編使用此SDK生成的任何結(jié)果,并在非英偉達平臺上進行轉(zhuǎn)譯。”
▲英偉達CUDA EULA相關(guān)限制條款截圖???????????????
EULA鏈接:https://docs.nvidia.com/cuda/eula/index.html
一石激起千層浪。GPU行業(yè)長期患有“CUDA依賴癥”,英偉達多年來不斷鞏固的CUDA生態(tài)墻就像銅墻鐵壁,是其他GPU新秀難以望其項背的關(guān)鍵壁壘。為了迎合市場需求,一些非英偉達的GPU平臺選擇兼容CUDA,以站在英偉達生態(tài)的肩膀上去擁抱GPU開發(fā)者。
這一消息隨即引起討論:CUDA兼容禁令意味著什么?是否會對國內(nèi)GPU企業(yè)產(chǎn)生不利影響?
對此,北京GPU獨角獸企業(yè)摩爾線程發(fā)聲明澄清:“摩爾線程MUSA/MUSIFY不涉及英偉達EULA相關(guān)條款,開發(fā)者可放心使用?!?/p>
▲摩爾線程的澄清聲明部分內(nèi)容截圖
據(jù)Tom’s Hardware報道,兼容CUDA有兩種常見做法:重新編譯代碼(可供相應(yīng)程序的開發(fā)人員使用),使用轉(zhuǎn)譯層。
其中第一種重新編譯現(xiàn)有CUDA程序的做法是合規(guī)的。AMD和英特爾都有工具來分別將CUDA程序遷移到他們的ROCm和OpenAPI平臺上。一些國內(nèi)GPU企業(yè)也采用了類似的兼容思路。
EULA條款主要禁掉的是第二種,使用像ZLUDA開源庫之類的轉(zhuǎn)譯層。外媒稱這是在非英偉達硬件上運行CUDA程序的最簡單方法。
此前英特爾和AMD都支持過ZLUDA項目,但后續(xù)又都停止了。ZLUDA利用ROCm技術(shù)棧上實現(xiàn)CUDA應(yīng)用二進制兼容,支持無需修改代碼就能在AMD硬件平臺上運行CUDA應(yīng)用。
開發(fā)者之所以對英偉達GPU長期專情,就是因為CUDA已經(jīng)足夠好用,跟英偉達GPU硬件的軟硬協(xié)同也做到最好,沒必要換個新平臺重頭熟悉,而且其他平臺還可能存在出現(xiàn)潛在bug的風(fēng)險。
然而如果能實現(xiàn)在其他硬件上跑CUDA,雖然會有一定性能損失,但對縮小與英偉達的生態(tài)差距已經(jīng)相當(dāng)有利。這多少會威脅到英偉達在加速計算領(lǐng)域的霸主地位,英偉達做限制也不意外。
隨著生成式AI越來越火,被視作英偉達GPU護城河的CUDA,其兼容性已成一個熱門話題。
去年在紐約舉行的一次活動上,英特爾CEO基辛格在對CUDA技術(shù)大加贊賞的同時,也坦言“整個行業(yè)都在積極消除CUDA市場”。
當(dāng)時他列舉了MLIR、谷歌、OpenAI等例子,暗示他們正轉(zhuǎn)向“Pythonic編程層”,使AI訓(xùn)練更加開放。他認為“CUDA護城河又淺又小”,其主導(dǎo)地位不會永遠持續(xù)下去,因為行業(yè)有動力為廣泛的訓(xùn)練、創(chuàng)新、數(shù)據(jù)科學(xué)等帶來更廣泛的技術(shù)。
AMD CEO蘇姿豐去年接受外媒采訪時談到自己不相信護城河,在她看來,過去開發(fā)者傾向于使用針對特定硬件的軟件,但展望未來,每個人都在尋求構(gòu)建與硬件無關(guān)的軟件能力,人們希望確保能從一種基礎(chǔ)設(shè)施遷移到另一種基礎(chǔ)設(shè)施,因此正在構(gòu)建這些更高級別的軟件。
上個月,硅谷芯片架構(gòu)大神Jim Keller也在社交平臺上發(fā)牢騷:“CUDA是沼澤,不是護城河?!彼虏蹖慍UDA效率低下,Triton、Tensor RT、Neon、Mojo的存在是有很好理由的。
可以說,AI芯片和GPU領(lǐng)域苦CUDA久矣,業(yè)界對這種封閉生態(tài)已經(jīng)頗有微詞。兼容CUDA只是權(quán)宜之計,有長期雄心的芯片大廠或初創(chuàng)公司都在構(gòu)建自主軟件生態(tài),并力挺更加開放的生態(tài)。
以O(shè)penAI Triton為代表的開源編程語言正成為對抗CUDA封閉陣營的關(guān)鍵力量,通過極大簡化GPU加速編程過程、顯著減少編譯新硬件所需的工作量,減弱開發(fā)者對CUDA的依賴。
與此同時,當(dāng)GPU短缺問題愈發(fā)嚴重,迫切需要更多計算能力的AI企業(yè)可能會越來越多考慮AMD、英特爾等競爭對手的替代品。當(dāng)它們紛紛擼起袖子推出性能強大且更加經(jīng)濟高效的GPU產(chǎn)品時,英偉達的霸主地位將受到挑戰(zhàn)。
而從商業(yè)決策的角度來看,著眼于解決復(fù)雜視覺計算問題、持續(xù)創(chuàng)新的英偉達,也有充分理由來捍衛(wèi)自己長期積累下來的知識產(chǎn)權(quán)和商業(yè)碩果,讓客戶與其生態(tài)系統(tǒng)產(chǎn)生更加牢固的粘性。