【導(dǎo)讀】音頻/語音用戶接口(VUI)是未來人機交互的一個重要的新興趨勢,將越來越多地用于智能家居控制、樓宇自動化、智能零售、聯(lián)接的汽車、醫(yī)療等物聯(lián)網(wǎng)垂直領(lǐng)域,這涉及語音觸發(fā)、識別、處理技術(shù),同時設(shè)計人員還面臨如何提高能效的挑戰(zhàn)。針對本地和云端,安森美半導(dǎo)體都有相應(yīng)的VUI方案,提供先進的語音觸發(fā)、識別、處理、控制等功能,具備出色的計算能力和能效,確保卓越的用戶體驗。
VUI架構(gòu)及分類
圖1是基于麥克風(fēng)陣列的高級語音接口架構(gòu),本地處理需要進行說話人跟蹤、語音增強,其中涉及波束成形、喚醒詞檢測、聲源定位、降噪、語音檢測等技術(shù),云端方案則涉及自然語言處理。其后,指令還需通過音頻播放功能播放出來,同時需進行回聲消除。
圖1:基于麥克風(fēng)陣列的高級語音接口架構(gòu)
本地VUI以預(yù)存的詞或句為識別單位,說話人可以是特定用戶也可以是非特定用戶,而云端VUI基于人工智能進行語義理解和語音合成,說話人是非特定用戶。本地VUI通過藍牙聯(lián)接網(wǎng)絡(luò),而云端VUI通常通過WiFi聯(lián)接。本地VUI的功耗和信息泄露的風(fēng)險相對更低,云端VUI具有更高的識別率和擴展性。相對而言,本地VUI比云端VUI的功耗低。設(shè)計人員可根據(jù)特定應(yīng)用需求決定是用本地VUI方案還是云端VUI方案。
本地VUI方案
根據(jù)本地VUI方案的特點,它必須能進行雙向語音通信,能識別非特定用戶語音,支持充足的指令和多種語言,可靈活擴展,最好把波束成形和降噪等技術(shù)集成到單個芯片上以降低成本和減小占位。如安森美半導(dǎo)體的單芯片方案LC823450,含雙Cortex-M3核,集成數(shù)字信號處理(DSP)用作語音前端處理,SRAM提供1656k字節(jié)內(nèi)存,無需配備輔助內(nèi)存芯片,含兩個數(shù)字麥克風(fēng)I/F接口、兩個數(shù)模轉(zhuǎn)換器,包括回音消除、降噪等先進功能,具備極高擴展性、小占位,功耗超低,若結(jié)合生態(tài)系統(tǒng)合作伙伴的語音控制技術(shù)如Sensory的TrulyHandsfree,支持喚醒詞和語音命令的定制,適用于家居自動化和音樂播放的語音交互。
圖2所示為本地VUI方案的一個示例應(yīng)用框圖及評估板。采用安森美半導(dǎo)體的超低功耗音頻處理單芯片LC82345X、麥克風(fēng)預(yù)放大器FAN3852、低壓降穩(wěn)壓器(LDO)NCP170、同步PWM開關(guān)降壓穩(wěn)壓器NCP3170、單聲道音頻功率放大器NCP2823。安森美半導(dǎo)體憑借在電源管理的經(jīng)驗和專知,使這方案實現(xiàn)超低功耗,這是此方案與其他競爭對手方案相比的一個優(yōu)勢?,F(xiàn)有的方案雖然未集成WiFi、藍牙雙模的模塊,但安森美半導(dǎo)體已收購了WiFi領(lǐng)袖Quantenna,已具備相關(guān)技術(shù),未來會考慮將WiFi模塊也集成進去。
圖2:語音控制應(yīng)用框圖及評估板
云端VUI方案
從應(yīng)用場景來看,云端VUI除了進行語義理解和語音合成,還可推送各種服務(wù),如智能語音助手除了可播放音樂、講故事,還支持智能零售,如打車、叫外賣等。當(dāng)前云端VUI的一個痛點是工作頻率較高,需外接存儲器和閃存,耗電量大,物料單(BoM)成本高。安森美半導(dǎo)體的音頻DSP系統(tǒng)單芯片(SoC)LC823455方案很好地解決了這些痛點問題,集成4M RAM,無需外部存儲,除了CPU核外還含波束成形、降噪、回音消除功能,集成預(yù)實現(xiàn)的音頻硬件(模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn)換器及功放),降低BoM成本,因降低時鐘頻率從而提供功耗優(yōu)化的MCU,功耗超低,提供穩(wěn)定的聯(lián)接和極高擴展性,寬廣的封裝陣容支持各種音頻產(chǎn)品,如音樂播放器、錄音器、智能家電、WiFi/藍牙音箱等。
圖3所示為智能音箱參考設(shè)計框圖,此參考設(shè)計基于LC823455,有4個ONA101V和1個ONA40功放,含USB-C PD源/汲接口,支持Strata平臺,設(shè)計人員只需將此評估板插入裝有Strata的電腦,即可自動識別并開始下載相關(guān)的所有文檔及配套資料,包括原理圖、布板、測試報告、用戶指南等,同時出現(xiàn)圖形用戶界面(GUI),顯示所有相關(guān)參數(shù)和選項供工程師開始評估,幫助加快和簡化開發(fā)。此參考設(shè)計目前支持亞馬遜Alexa語音服務(wù),安森美半導(dǎo)體也在同中國國內(nèi)一些語音服務(wù)商接洽,未來也會支持國內(nèi)語音助手。這方案最顯著的一個優(yōu)勢也是超低功耗,經(jīng)過將其與競爭對手方案的功耗進行測試,安森美半導(dǎo)體的方案功耗約為競爭對手方案功耗的一半。
圖3:智能音箱參考設(shè)計框圖
安森美半導(dǎo)體的移動及智能音箱音頻技術(shù)/知識產(chǎn)權(quán)
安森美半導(dǎo)體具備豐富的知識產(chǎn)權(quán)支持移動及智能音箱的設(shè)計開發(fā),包括音頻處理系統(tǒng)、D類功放、麥克風(fēng)預(yù)放大、高性能音頻開關(guān),提供具競爭力的優(yōu)勢助力設(shè)計人員設(shè)計出具競爭優(yōu)勢的產(chǎn)品。
在音頻處理系統(tǒng)方面的競爭優(yōu)勢包括小的PCB占位、高度集成的SoC(CPU+DSP+音頻)、集成ARM Cortex-M3雙核、專有的32位DSP。
在D類功放方面,支持小于10 W、10W至30 W,針對大于30 W的應(yīng)用僅提供樣品。其中小于10 W的功放尺寸小,采用模擬輸入,10W至30W的功放支持數(shù)字接口,提供最佳的動態(tài)范圍、增益誤差漂移。
對于麥克風(fēng)預(yù)放大,安森美半導(dǎo)體的方案采用最小的標準間距WLCSP封裝將模擬音頻轉(zhuǎn)換為數(shù)字音頻,支持不同的傳感器接口。
音頻開關(guān)方面,安森美半導(dǎo)體提供最小阻抗/面積的耗盡型開關(guān)。
周邊技術(shù):USB Type-C和D類功放
USB Type-C使每個端口都能成為電源、數(shù)據(jù)、視頻或音頻端口,大大地方便了用戶,將越來越多地用于各種電子應(yīng)用,如語音交互。安森美半導(dǎo)體提供完整的USB Type-C方案陣容支持音頻應(yīng)用的開發(fā),包括供電、復(fù)用音頻信號、信號開關(guān)、接口保護等,具有最小的占位、超低靜態(tài)功耗,集成豐富的保護功能。
智能音箱等新興音頻應(yīng)用對功放的要求越來越高,安森美半導(dǎo)體針對性地開發(fā)出了一系列10 W以上功率等級的D類功放產(chǎn)品線,結(jié)合陶瓷封裝技術(shù)、CMOS電路技術(shù)及可針對不同應(yīng)用定制的功率MOSFET技術(shù),提供低熱阻、高頻互聯(lián)、高功率密度、低噪聲(<70 uV)、低總諧波失真(THD<0.03%)等優(yōu)勢。以O(shè)NA101V為例,這是一款單通道數(shù)字輸入D類功放,動態(tài)范圍105 dB,帶喇叭采樣數(shù)字輸出功能,該功能實時采樣所驅(qū)動喇叭的電壓和電流,可使用微控制器上運行的算法來計算喇叭特性。這些參數(shù)可用于計算喇叭電阻、回響、溫度等。根據(jù)這些值,可以創(chuàng)建算法來執(zhí)行一系列任務(wù),從而實現(xiàn)喇叭保護、范圍擴展等功能。
總結(jié)
語音交互正日漸流行,語音識別和自然語言處理技術(shù)是VUI的基礎(chǔ),安森美半導(dǎo)體提供本地VUI方案和云端VUI方案,集成波束成形、回音消除、降噪等先進的語音處理技術(shù)、超低功耗電源管理及USB Type-C、D類功放等周邊器件,并攜手生態(tài)鏈合作伙伴,大大降低BoM成本,同時具備出色的計算能力和超低功耗,提供極佳的用戶體驗。
推薦閱讀: