近年來,利用 ADAS(高級駕駛輔助系統(tǒng))等向行人和搭乘人員告知車輛狀態(tài)和存在已經(jīng)變得非常重要,汽車制造商們正在推進(jìn)語音輸出系統(tǒng)的開發(fā),通過音效和語音來發(fā)出警告或通知,仔細(xì)觀察的用戶會聽出不同品牌的汽車播報時長不同、聲音大小也不同。如果從安全角度考慮,警報聲的響應(yīng)速度非常關(guān)鍵。通常汽車播報采用兩種控制方式,一種是 MCU 控制,一種是硬件控制。但是隨著車載功能的增加,主控 MCU 的負(fù)荷越來越重,方案廠商也在試圖減輕 MCU 的負(fù)擔(dān)。
羅姆集團(tuán)旗下的藍(lán)碧石公司最近推出一款新型車載語音合成 LSI --ML2253x 系列,將語音播報功能通過硬件控制,從而將主控 MCU 解放出來。LAPIS 于 2008 年從日本沖電氣工業(yè)集團(tuán)分離出來,并入了羅姆集團(tuán)旗下,2011 年正式更名為藍(lán)碧石半導(dǎo)體股份有限公司。LAPIS 公司有四大核心技術(shù):低功耗技術(shù)、高頻電路技術(shù)、數(shù)字模擬混載技術(shù)、存儲器設(shè)計技術(shù),提供獨具特色的 LSI 產(chǎn)品和晶圓代工服務(wù)。LAPIS 的語音芯片經(jīng)過 40 多年的發(fā)展,全球銷量一年 1500 萬片,在日本市場排名第一。
響應(yīng)速度快,抗干擾能力強(qiáng)
通過 MCU 來實現(xiàn)語音輸出需要外接主控 MCU、放大器、存儲器等元器件,并且需要主控 MCU 的軟件支持,而且軟件設(shè)計非常復(fù)雜。主控 MCU 在進(jìn)行非語音播報事件處理時,可能無法進(jìn)行語音播報,或者推遲語音播報。
羅姆公司高級工程師佘夢怡女士介紹,“我們的語音合成 LSI 全部由硬件組成,對主控 MCU 不會產(chǎn)生負(fù)荷,系統(tǒng)在接收到命令之后,5 毫秒內(nèi)播放語音,另外,芯片中內(nèi)置有通信接口、邏輯、存儲器、放大器,可構(gòu)建不依賴于主控 MCU 的語音輸出系統(tǒng),并可減少軟件設(shè)計工時?!?/p>
汽車在行駛中會面臨各種噪音干擾,比如儀表盤旁邊的 AM 頻率干擾會影響 D 類功放,為了盡可能降低干擾,ML22Q53x 系列中配置了 AB 類功放,雖然 AB 類功放沒有 D 類功放的效率高,但是抗干擾能力比 D 類功放強(qiáng)。另外,如果客戶選用 AVAS(汽車聲音警報系統(tǒng))產(chǎn)品,芯片內(nèi)置 1W 功放無法滿足要求,用戶可以將音頻輸出到外接的 10W 功放進(jìn)行放大。
故障檢測功能:增強(qiáng)系統(tǒng)安全性
隨著自動緊急制動系統(tǒng)(AEBS)相關(guān)法律法規(guī)的實施,以及市場上 ADAS 警告類型增加,用戶對車內(nèi)語音的要求也越來越嚴(yán)苛。車廠不僅要確保常規(guī)的車載品質(zhì),還必須保整車系統(tǒng)的安全性。因此,ML2253x 系列增加了故障檢測功能。
羅姆公司技術(shù)中心主管姚玲玲解釋,“以前車載系統(tǒng)接到指令后,并無法確定播放系統(tǒng)是否在播,播放的內(nèi)容是否正確,加入了播放音異常檢測功能后,可以檢測出模擬電路的異常,并反饋給主控 MCU,還可以檢測出在系統(tǒng)端無法確認(rèn)的語音播放問題,提高了應(yīng)用的產(chǎn)品品質(zhì),隨時也確保終端產(chǎn)品的安全性,這個功能作為規(guī)避風(fēng)險預(yù)案備受矚目?!?/p>
靈活配置Flash,通過MCU實現(xiàn)擦寫
ML2253x 系列包括兩種產(chǎn)品,一種內(nèi)置 FLASH 的 M22Q53x 系列,F(xiàn)lash 大小提供 2M、4M、16M 三種可選,內(nèi)部 FLASH 可擦寫的次數(shù)是 100 次;另外一種是外置存儲器的 ML22530 系列,最大可以擴(kuò)到 128M。
佘夢怡表示,“該芯片可通過主控 MCU 進(jìn)行 FLASH 的改寫,可在開發(fā)中進(jìn)行修改數(shù)據(jù),即便是在終端產(chǎn)品上也可以通過主控 MCU 進(jìn)行一個數(shù)據(jù)修改,既便捷又靈活?!?/p>
算法壓縮方式獨特,音效音質(zhì)有保障
ML2253x 系列支持 HQ-ADPCM 的算法壓縮方式,據(jù)介紹,這一算法是由藍(lán)碧石半導(dǎo)體公司聯(lián)合日本九州工業(yè)大學(xué)共同開發(fā),可以保持高音質(zhì)和音效的同時,進(jìn)行一個高壓縮率的算法。相對 ADPCM 算法、非線性 PCM 以及 PCM 算法,它的壓縮率可以對比原文壓縮到五分之一的大小,用戶更加節(jié)省存儲空間,從而節(jié)省成本。
佘夢怡解釋,“我們的芯片采樣頻率是從 6.4K 到 48K,其中 48K 可以媲美 CD 的音質(zhì),而且每一段語音都可以設(shè)置不同的采樣頻率。同樣是 6.4K 的采樣頻率,采用 HQ-ADPCM 算法的最長播放時間在 128M 時可以達(dá)到 6541 秒,內(nèi)置 2M Flash 也可以達(dá)到 90 秒。采用 HQ-ADPCM 方式還原后,很多硬件可以進(jìn)行算法補(bǔ)充,在實際播放時存在 FLASH 的容量最多達(dá)到 40 倍的數(shù)據(jù)量,比如 5 個字節(jié)的數(shù)據(jù)可以擴(kuò)展到 200 個字節(jié),數(shù)據(jù)量越多,語音表現(xiàn)越好?!?/p>
為了滿足音頻輸出需求,芯片設(shè)有 SPI 和 I2C 兩種接口,每個通道同時支持四通道混音后從一通道輸出,可以在不同的通道選擇不同的語音,比如音樂、語音可以從不同的通道播放。在進(jìn)行播放輸出時雖然只有一通道輸出,但音源可以選擇兩通道混音、四通道混音、有背景音樂等不同的選項單獨播放。
一站式解決方案
關(guān)于實際應(yīng)用,佘夢怡認(rèn)為,“ML22Q53x 和 ML22530 適用于快速發(fā)聲場合,對于汽車的定位或者類型沒有特殊要求。區(qū)別是帶 Q 的有內(nèi)置 FLASH,不帶 Q 的客戶可以外接 FLASH,比較靈活。目前,在日本本土已經(jīng)有一些知名廠商在評估、測試階段,國內(nèi)有一些客戶開始做前期測試,我們的產(chǎn)品 4 月份出樣品,在 8 月會量產(chǎn)?!?/p>
在客戶進(jìn)行開發(fā)時,羅姆可以提供整套開發(fā)套件,開發(fā)套件的硬件部分包含聲音控制板、SDCB3 板,不同型號對應(yīng)不同的燒寫板,兩塊板子連起來后,用戶可以連接電腦、連接揚聲器等一些硬件進(jìn)行播放,同時羅姆提供一個自主研發(fā)的軟件 Speech LSI Utility,可以進(jìn)行波形編輯、短語編輯試聽,生成工程文件、燒寫芯片等研發(fā)必備功能。
“羅姆一貫的特色是提供一站式服務(wù),從產(chǎn)品開發(fā)到后面的選型、原理圖、PCB,以及 MCU 軟件,我們會協(xié)助客戶做調(diào)試,量產(chǎn)之后的問題也可以一起解決。車內(nèi)語音市場的規(guī)模大概有 50 億日元,車載市場的入門門檻相對較高,需要通過 AEC-Q100 或者 ISO 26262 標(biāo)準(zhǔn)。羅姆的優(yōu)勢是有自主產(chǎn)品線和 LAPIS 產(chǎn)品線相互補(bǔ)充,還針對 ISO 26262 已經(jīng)取得了流程認(rèn)證。”佘夢怡補(bǔ)充。
ML22530x系列DEMO板演示
該 DEMO 板基于 ML22530 語音芯片設(shè)計,開發(fā)板上有語音芯片、MCU、外置 FLASH,以及外置功放組成。MCU 只需要發(fā)送一個簡單的指令就可以控制語音芯片,語音芯片從外部 FLASH 中讀取數(shù)據(jù)進(jìn)行播放。芯片內(nèi)部集成了 1W 功放,設(shè)置有一個 1W 的輸出口,連接上喇叭即可播放聲音,板子上設(shè)有三個按鈕進(jìn)行語音數(shù)據(jù)選擇。
工程師展示了用在 AVAS(汽車聲音警報系統(tǒng))產(chǎn)品上的聲音,模擬電動汽車的引擎音,可以通過滑動變阻器調(diào)節(jié)聲音的大小,通過不同的阻值使用 AD 變換,再通過 MCU 選擇相應(yīng)的語音數(shù)據(jù)進(jìn)行播放。
針對車內(nèi)安全性提醒的應(yīng)用,可以模擬汽車轉(zhuǎn)向燈的聲音、汽車在剛啟動時的歡迎音樂等。佘夢怡強(qiáng)調(diào),“如果客戶是用在 AVAS(汽車聲音警報系統(tǒng))產(chǎn)品上,由于芯片內(nèi)部只有 1W 功放,我們建議客戶外置功放,這樣才能起到提醒的作用,讓路邊的行人聽到車子的引擎聲音?!?/p>