NVIDIA 今天宣布推出一款工具,只需 30 分鐘的音頻數(shù)據(jù),即可在一天之內(nèi)打造類似真人的定制語音。
NVIDIA Riva 定制語音是 NVIDIA Riva 語音 AI 軟件的一項功能,它提供強(qiáng)大的功能,使數(shù)百萬公司使用少量數(shù)據(jù)即可在幾小時而不再是幾周內(nèi)開發(fā)富有表現(xiàn)力的定制語音。
企業(yè)可以使用 Riva 定制語音打造具有專屬語音的虛擬助理。呼叫中心可以借其快速開發(fā)具有辨識度的品牌語音,為客戶提供服務(wù)。開發(fā)者可以借其創(chuàng)建各種各樣的應(yīng)用程序,為有語言障礙的人提供支持。
NVIDIA AI軟件產(chǎn)品管理副總裁Kari Briski表示:“長期以來,模仿類似真人的互動一直是AI面臨的一項巨大挑戰(zhàn),特別是對于那些具有行業(yè)術(shù)語的公司而言?,F(xiàn)在,這些公司能夠使用語音 AI 傾聽客戶,并且以他們品牌專屬的、富有表現(xiàn)力的語音回復(fù)客戶,推動更有趣味、更加愉悅的互動?!?/p>
最新版的 NVIDIA Riva 語音 AI 軟件開發(fā)套件提供 Riva 定制語音。Riva SDK 包括先進(jìn)的自動語音識別和文本到語音轉(zhuǎn)換功能,可根據(jù)不同的口音和領(lǐng)域進(jìn)行定制。它還能夠?qū)⒄Z音服務(wù)擴(kuò)展到云、數(shù)據(jù)中心及邊緣的數(shù)十萬串流。
?
生態(tài)系統(tǒng)之聲
在不到三年的時間里,NVIDIA 的對話式 AI 軟件已實現(xiàn) 25 萬次以上的下載量,在眾多行業(yè)得到廣泛應(yīng)用。
RingCentral 是全球企業(yè)云通信、視頻會議、協(xié)作和客服中心解決方案的優(yōu)秀供應(yīng)商,正在借助 Riva 自動語音識別提供視頻會議實時字幕功能,打造更具吸引力的會議體驗。
RingCentral 執(zhí)行副總裁兼產(chǎn)品和工程總經(jīng)理 Nat Natarajan 表示:“我們的目標(biāo)是讓會議更智能,現(xiàn)在借助 NVIDIA Riva,能夠基于 NVIDIA GPU 訓(xùn)練實時轉(zhuǎn)錄模型,提高不同口音的準(zhǔn)確性。未來,我們預(yù)計會有多個并發(fā)串流,Riva 可以輕松擴(kuò)展,在 300 毫秒內(nèi)實時處理這些串流。我們很高興能與 NVIDIA 合作,一起展望未來。”
中國平安是全球最大的金融服務(wù)公司之一,正通過虛擬代理人來減少等待時間,改善客戶體驗。借助 Riva,它可以構(gòu)建實時語音應(yīng)用程序,不斷提高準(zhǔn)確性。
?中國平安首席科學(xué)家肖京表示:“中國平安每天使用聊天機(jī)器代理人處理數(shù)百萬客戶查詢。借助 NVIDIA 面向自動語音識別的預(yù)訓(xùn)練模型,在我們的數(shù)據(jù)上進(jìn)一步微調(diào),我們的系統(tǒng)在準(zhǔn)確性方面提高了 5%,讓我們能夠提供更具吸引力、更加可靠的服務(wù)。”
?此外,還有數(shù)十家軟件制造商在生產(chǎn)中使用 NVIDIA 對話式 AI。Gosoft Contact Center 正在與 CP All 合作,后者擁有 20 多個業(yè)務(wù)領(lǐng)域,其零售領(lǐng)域在泰國涵蓋 10000 多家 7-11 便利店。高度準(zhǔn)確的 AI 語音機(jī)器人在泰語方面經(jīng)過訓(xùn)練,每天總計可以幫助處理 24 萬次呼叫。
Plabook Education 和 Data Monsters 正在與美國各地的學(xué)區(qū)合作,幫助孩子們學(xué)習(xí)通過 AI 數(shù)字虛擬形象閱讀助理進(jìn)行閱讀,該助理可以幫助識別發(fā)音錯誤的單詞并衡量其閱讀準(zhǔn)確性。
供貨情況和定價
針對小型研發(fā),NVIDIA Riva 在 NVIDIA NGC? 容器倉庫上免費(fèi)提供。開發(fā)者可以加入 Riva 開放測試計劃,立即試用軟件并且接收相關(guān)功能更新通知。
對于具有大規(guī)模部署和尋求 NVIDIA 專家技術(shù)支持的客戶,NVIDIA 還宣布 NVIDIA Riva 企業(yè)版計劃,該計劃預(yù)計將于明年初推出。
Riva亮相GTC
?在GTC主題演講中,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛展示了Riva的語音AI能力,其中包括在Riva自定義語音的演示中,展示了只需30分鐘的數(shù)據(jù)就能創(chuàng)造出類似人類的新的聲音。
Riva還通過Project Tokkio、DRIVE Concierge和Project Maxine在Omniverse Avatar(一個創(chuàng)建交互虛擬形象的平臺)中得以展現(xiàn)。Project Tokkio和DRIVE Concierge展示了客戶服務(wù)和車內(nèi)環(huán)境中的虛擬形象,而Project Maxine則強(qiáng)調(diào)了實時翻譯并轉(zhuǎn)錄到多種語言。
在GTC上,有二十多場專注于對話式AI的演講,包括Hugging Face、Snap、T-Mobile等公司的演講。演講主題涉及開發(fā)和整合GPU加速的語音和語言AI應(yīng)用等方面最先進(jìn)的算法、工具、挑戰(zhàn)以及效果等。
免費(fèi)注冊GTC 2021詳細(xì)了解 NVIDIA Riva,大會以線上形式舉行,持續(xù)到11月11日。歡迎觀看黃仁勛在 11 月 9 日的 GTC 主題演講的直播以及重播。
在線觀看NVIDIA Riva 定制語音軟件介紹視頻:https://www.ixigua.com/7028556117475066382?logTag=975d654e77ae53fc0fe4?