NVIDIA生成式AI推理平臺將集成至谷歌云Vertex AI中;谷歌云成為首家提供NVIDIA L4 GPU實例的云服務商
NVIDIA今日宣布正與谷歌云合作,以幫助企業(yè)加速創(chuàng)建數(shù)量急劇增加的生成式AI應用。
谷歌云宣布從即日起提供 G2 虛擬機的非公開預覽,成為首家提供NVIDIA L4 Tensor Core GPU的云服務商。 此外,L4 GPU將在Vertex AI上提供優(yōu)化支持,該平臺現(xiàn)在支持構建、調(diào)整和部署大型生成式AI模型。
開發(fā)人員可以訪問最先進的技術,幫助他們快速、經(jīng)濟地啟動和運行新應用。L4 GPU是一款適用于幾乎所有工作負載的通用GPU,具有更加強大的AI視頻功能,可提供比CPU高120倍的AI視頻性能,同時能效提高了99%。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“生成式AI的大熱激發(fā)了一輪公司轉(zhuǎn)向云計算來支持自身業(yè)務模式的熱潮。我們正在與谷歌云一起幫助他們以更容易的方式獲取所需要的功能并創(chuàng)造出超凡的新工具和應用?!?/p>
谷歌云系統(tǒng)和服務基礎設施副總裁Amin Vahdat表示:“生成式AI代表著一個新計算時代的到來,而這個時代正需要我們在谷歌云上提供的速度、可擴展性和可靠性。我們的客戶已開始探索生成式AI的可能性,我們十分高興能夠?qū)VIDIA新的L4 GPU創(chuàng)新作為谷歌工作負載優(yōu)化的Compute Engine產(chǎn)品組合的一部分供他們使用。”
幫助實現(xiàn)新一代生成式AI 應用
谷歌云為各種提供生成式AI應用的企業(yè)機構提供基礎設施,其中許多基礎設施的設計初衷就是為了幫助專業(yè)人士更好、更快地完成工作。而快速的推理正是成功運行他們這些應用的關鍵。
生成式AI也在推動許多新應用的發(fā)展,幫助人們建立聯(lián)系、獲得樂趣。WOMBO提供的一款名為Dream 的應用程序是一款AI驅(qū)動的文字-數(shù)字藝術轉(zhuǎn)換應用。該公司是谷歌云上NVIDIA L4推理平臺的早期用戶之一。
WOMBO首席執(zhí)行官Ben-Zion Benkhin表示:“WOMBO借助最新的AI技術,使人們能夠根據(jù)用戶的提示,創(chuàng)造出沉浸式的數(shù)字藝術作品,讓其僅憑一個想法就能創(chuàng)造出任何風格、高質(zhì)量、逼真的藝術作品。NVIDIA的L4推理平臺將使我們能夠為希望創(chuàng)造和分享獨特藝術作品的用戶提供更完善、更高效的圖像生成體驗?!?/p>
Descript提供基于AI的編輯功能,創(chuàng)作者只需要點擊幾下就能刪除填充詞、添加標題并進行社交媒體內(nèi)容剪輯。他們也可以使用Descript的生成式AI語音克隆功能,只需通過輸入就能修復音頻錯誤,甚至創(chuàng)建整個配音的音軌。
Descript首席執(zhí)行官Andrew Mason表示:“Descript使用NVIDIA TensorRT來優(yōu)化模型,加快了AI推理速度。用戶能夠替換視頻背景并增強語音,從而無需進入錄音室就能制作出堪比錄音室品質(zhì)的內(nèi)容。”
供應情況
NVIDIA L4 GPU現(xiàn)已在谷歌云上提供非公開預覽。