加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

智能交互的盡頭是聊天?

2022/06/10
407
閱讀需 5 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

-Hi Siri,今天天氣怎么樣?

-今天天氣晴,18℃至27℃,空氣質(zhì)量指數(shù)36,優(yōu)。

手機(jī)、手表、音箱等智能設(shè)備極大地便利了我們的生活,隨著語音交互設(shè)備的發(fā)展,智能交互依然面臨很多挑戰(zhàn)。

我們每天要說成百上千句話,長(zhǎng)短不一。即便是一些轉(zhuǎn)瞬即逝的口頭語,也可以成為傳達(dá)自我意識(shí)的載體,向他人準(zhǔn)確傳達(dá)信息??烧Z言似乎是人類群體特有的專利,在過往的時(shí)間中,想借助語言與其他物種、物體建立清晰明確溝通關(guān)系的可能性無限趨近于零,直到智能語音技術(shù)的出現(xiàn)。

作為最早落地的人工智能技術(shù)之一,AI語音技術(shù)已經(jīng)得到了長(zhǎng)足的發(fā)展。如今,智能語音技術(shù)已經(jīng)被廣泛集成的就是家居產(chǎn)品之中。在即將到來的萬物互聯(lián)時(shí)代,以語音交互為主的智能設(shè)備無疑將極具競(jìng)爭(zhēng)力與吸引力。仔細(xì)一想,一眾充滿科技感與未來感的智能設(shè)備,將天然具備人類最熟悉的“原始交互方式”,也頗有些化繁為簡(jiǎn)、返璞歸真的意味。

語音交互設(shè)備的“助聽器”——ASR

在復(fù)雜環(huán)境中,我們總是可以忽略或弱化無關(guān)噪聲,集中注意力進(jìn)行溝通,但語音交互設(shè)備在如此環(huán)境中只會(huì)無所適從,不免陷入“交互尚未開始,便已結(jié)束”的囧境。故此,設(shè)備擁有對(duì)各類“聲學(xué)場(chǎng)景”的聲源信號(hào)進(jìn)行處理、優(yōu)化功能的必要性不言而喻。而借助降噪NS、語音增強(qiáng)SE等技術(shù),可以對(duì)聲學(xué)場(chǎng)景中的非語音噪音信號(hào)進(jìn)行抑制,從含有噪音的語音信號(hào)中提取純凈語音,提升語音識(shí)別效果,讓語音交互設(shè)備可以分辨、傾聽出目標(biāo)聲音,進(jìn)而為后續(xù)的語音交互掃清障礙。

語音識(shí)別技術(shù)(ASR)的加持下,語音交互設(shè)備能對(duì)聲音信號(hào)進(jìn)行特征提取,提取而出的“特征”會(huì)作為參數(shù),為模型計(jì)算做準(zhǔn)備。簡(jiǎn)單理解就是將語音信息數(shù)字化,再通過相應(yīng)的模型對(duì)數(shù)字化信息進(jìn)行計(jì)算。后續(xù)通過聲學(xué)模型計(jì)算得出相應(yīng)的音素(即把聲音轉(zhuǎn)成音素),其目的是根據(jù)音素來找到對(duì)應(yīng)的漢字或者單詞,最終轉(zhuǎn)換成設(shè)備可以理解的文本。

語音交互設(shè)備的“聲卡”——TTS

 

基于語音合成技術(shù)(TTS),語音交互設(shè)備可對(duì)文本逐句分析,進(jìn)行詞匯、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的所對(duì)應(yīng)的音素組成,包括文本的斷句、字詞切分、多音字處理以及數(shù)字處理等。

在內(nèi)置芯片神經(jīng)網(wǎng)絡(luò)技術(shù)的支持下,語音交互設(shè)備可把處理好的文本所對(duì)應(yīng)的單字或短語從語音合成庫(kù)中提取,使語言學(xué)描述轉(zhuǎn)化成言語波形,即把文字智能地轉(zhuǎn)化為自然語音流。至此,一次完整的語音交互便成功完成。當(dāng)然,在特有的智能語音控制器作用下,文本輸出的語音音律將會(huì)更加流暢,使得聽者在聽取信息時(shí)感覺自然、毫無機(jī)器語音輸出的冷漠與生澀感。

寫在最后

誠(chéng)然,已普遍應(yīng)用于智能家居設(shè)備中的語音交互技術(shù)仍面臨諸多挑戰(zhàn),在設(shè)備喚醒率、識(shí)別率、誤報(bào)率、環(huán)境降噪等方面仍有改進(jìn)的空間。但毫無疑問,在未來語音作為人類最自然、最便捷的溝通方式,將會(huì)成為所有設(shè)備和產(chǎn)品至關(guān)重要的入口和人與機(jī)器之間的通信紐帶,而強(qiáng)邏輯、無視覺或者弱視覺的智能語音技術(shù)也會(huì)找到更多用武之地。

安富利

安富利

安富利(Avnet)創(chuàng)立于1921年,總部位于美國(guó)亞利桑那州鳳凰城,是財(cái)富500強(qiáng)企業(yè)。公司的業(yè)務(wù)網(wǎng)絡(luò)遍布世界各地,在全球擁有300余家辦事處,為遍布全球140個(gè)國(guó)家的超100萬客戶提供全方位的技術(shù)支持和供應(yīng)鏈服務(wù)。

安富利(Avnet)創(chuàng)立于1921年,總部位于美國(guó)亞利桑那州鳳凰城,是財(cái)富500強(qiáng)企業(yè)。公司的業(yè)務(wù)網(wǎng)絡(luò)遍布世界各地,在全球擁有300余家辦事處,為遍布全球140個(gè)國(guó)家的超100萬客戶提供全方位的技術(shù)支持和供應(yīng)鏈服務(wù)。 收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

安富利助您將今日構(gòu)思轉(zhuǎn)化為明日科技。我們幫助初創(chuàng)企業(yè)設(shè)計(jì)和制造,讓這些技術(shù)夢(mèng)想家準(zhǔn)備好成長(zhǎng)為新的大型企業(yè);也為需要全球供貨的合同制造商和OEM制造商提供優(yōu)質(zhì)產(chǎn)品與支持。