奧運會一直是高精尖科技爭相亮相的舞臺,一方面它是前沿技術(shù)最好的試煉場,另一方面也是出于高水準賽事的迫切需求。隨著生成式AI的發(fā)展和推廣,這項技術(shù)正在奧運會上展現(xiàn)出新的落地方向和應(yīng)用空間,不論是提升運動員表現(xiàn)、優(yōu)化賽事管理,還是增強觀眾體驗等方面,都為即將到來的2024年巴黎奧運會注入了新的活力。
日前,英特爾分享了與國際奧林匹克委員會(IOC)的一些合作細節(jié),并披露了以行業(yè)需求為導(dǎo)向所打造的生成式AI(GenAI)檢索增強生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于至強處理器和Gaudi AI加速器的開放式AI系統(tǒng)及平臺,幫助開發(fā)者和企業(yè)應(yīng)對AI高速發(fā)展所帶來的需求。
基于生成式AI RAG的聊天機器人,跨越數(shù)據(jù)障礙
AthleteGPT是國際奧委會與英特爾合作開發(fā)的一款聊天機器人,是一款基于英特爾至強處理器和Gaudi加速器的RAG解決方案,它可以說六種語言,包括英語、法語、西班牙語、普通話、俄語和阿拉伯語,11,000名運動員將能夠訪問這些語言,這幾乎涵蓋了他們的第一或第二語言。它不僅能夠應(yīng)答運動員的日常詢問并進行互動,同時將在運動員入住巴黎奧運村期間,為其按需提供信息,使運動員能夠?qū)W⒂谧陨碛?xùn)練和比賽。
對于奧運會這樣的國際大型賽事來說,英特爾通過與國際奧委會的合作,展示了AI普及化的一種方式。盡管這種獲取信息和互動的方式很好,但毫無疑問,“信息量”是一個主要挑戰(zhàn)。一直以來,AI的訓(xùn)練和部署在數(shù)據(jù)方面存在一定的制約和局限。對于企業(yè)來說,他們擁有大量數(shù)據(jù),這些數(shù)據(jù)往往是專有數(shù)據(jù)或歷史數(shù)據(jù),是企業(yè)寶貴的數(shù)字資產(chǎn)。LLM雖然是一項偉大創(chuàng)新,但如果無法安全訪問和應(yīng)用這些數(shù)據(jù)的話,也無法發(fā)揮力量。
英特爾方面認為,RAG的技術(shù)和范式可以將數(shù)據(jù)和LLM結(jié)合在一起,既可以確保企業(yè)數(shù)據(jù)的安全性,又能夠借助企業(yè)數(shù)據(jù)的具體性和準確性,使得LLM發(fā)揮出該有的價值。
據(jù)了解,AthleteGPT提供了RAG驅(qū)動的前端,它可以在幕后檢索數(shù)據(jù),無需運動員進行復(fù)雜操作,就可以有意義地解釋大量數(shù)據(jù)集中的信息。
企業(yè)AI開放平臺是大規(guī)模生成式AI RAG應(yīng)用的關(guān)鍵
在大規(guī)模應(yīng)用的生成式AI RAG解決方案中,一個重要根基是英特爾與行業(yè)合作伙伴共同創(chuàng)建了開源、可互操作的解決方案,用于輕松部署RAG。正是因為企業(yè)AI開放平臺(OPEA),能夠提供開源、標準化、模塊化,以及異構(gòu)的RAG流水線(pipeline),并致力于為開放式模型及多種編譯器和工具鏈的開發(fā)提供支持,加速了針對垂直領(lǐng)域用例的容器化AI集成與交付。
下圖是RAG的具體工作流程,該生成式AI一站式解決方案將基于OPEA的微服務(wù)組件集成至用于部署英特爾至強處理器和Gaudi AI系統(tǒng)的、可擴展的RAG解決方案中,可通過Kubernetes、Red Hat OpenShift等經(jīng)驗證的編排框架進行無縫擴展,并提供兼具可靠性和系統(tǒng)遙測功能的標準化API。
英特爾方面表示,幾乎所有大型語言模型(LLM)的開發(fā)都基于高級抽象框架PyTorch,該框架受英特爾Gaudi和至強技術(shù)的支持,使得在英特爾AI系統(tǒng)或平臺上進行開發(fā)變得輕而易舉。通過與OPEA合作,英特爾為RAG和LLM部署開發(fā)了一個開放的軟件堆棧,該堆棧針對GenAI交鑰匙解決方案進行了優(yōu)化,并基于PyTorch、Hugging Face服務(wù)庫(TGI和TEI)構(gòu)建。
關(guān)于生成式AI RAG解決方案的重要意義,英特爾方面認為,部署生成式AI解決方案會帶來諸如成本、規(guī)模、準確性、開發(fā)需求、隱私和可靠性等方面的挑戰(zhàn)。作為一種關(guān)鍵的生成式AI工作負載,RAG可以讓企業(yè)安全地利用專有數(shù)據(jù),增強AI產(chǎn)出結(jié)果的及時性與可靠性。這將極大地提高AI應(yīng)用的質(zhì)量和實用性。通過以協(xié)作的方式幫助開發(fā)者構(gòu)建定制化的生成式AI RAG解決方案,可以滿足企業(yè)的多樣化需求。此外,英特爾亦將持續(xù)提供開放、強大且可組合的多供應(yīng)商生成式AI解決方案。
除了生成式AI RAG聊天機器人,英特爾在支持巴黎奧運會的邊緣AI應(yīng)用中,還攜手三星打造基于AI技術(shù)的沉浸式互動體驗,能夠帶領(lǐng)觀眾體驗一系列專業(yè)的訓(xùn)練與分析,并為其匹配出最為合適的比賽項目。此外,還有幫助視障人士提高賽事觀賞體驗的AI解決方案,以及包括了全新體積視頻的3D播報形式,帶給觀眾沉浸式的實時體驗。
當前,如何將最新的AI計算技術(shù)應(yīng)用到實際場景中,并推動關(guān)鍵業(yè)務(wù)成果落地,是企業(yè)亟待解決的問題。通過與廣大行業(yè)合作伙伴的戰(zhàn)略合作,英特爾正為由生成式AI和RAG解決方案驅(qū)動的AI服務(wù)創(chuàng)造更多的可能性。