Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準確的 AI 推理
NVIDIA 今日宣布推出一項生成式 AI 微服務,支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應用能夠提供高度準確的響應。
NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務,通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。
作為一項語義檢索微服務,NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發(fā)者,可以將其 AI 應用與位于各個云和數(shù)據(jù)中心的業(yè)務數(shù)據(jù)相連通。該服務為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個殺手級應用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務數(shù)據(jù),通過準確且有價值的生成式 AI 智能來提高生產(chǎn)力?!?/p>
全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準確性
電子系統(tǒng)設(shè)計領(lǐng)導廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務。該公司正與 NVIDIA 合作,為工業(yè)電子設(shè)計領(lǐng)域的生成式 AI 應用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設(shè)計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關(guān)性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場?!?/p>
破解精確的生成式 AI 應用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持,來為生產(chǎn)就緒型生成式 AI 賦能。
經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數(shù)據(jù)。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅(qū)動的應用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓練獲得更準確的結(jié)果,加快產(chǎn)品上市時間,并減少生成式 AI 應用開發(fā)產(chǎn)生的能耗。
通過 NVIDIA AI Enterprise 實現(xiàn)可靠、簡單且安全的部署
企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。