免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)聯(lián)系小編進(jìn)行處理。
MEMS麥克風(fēng)在語音激活設(shè)計(jì)中如何輔助聲音檢測(cè)和關(guān)鍵詞識(shí)別
發(fā)布時(shí)間:2020-06-11 責(zé)任編輯:lina
【導(dǎo)讀】隨著用戶越來越依賴語音作為用戶界面,設(shè)計(jì)人員面臨著多重挑戰(zhàn),既要以盡可能小的功耗和響應(yīng)時(shí)間來實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語音界面 (VUI),又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。
隨著用戶越來越依賴語音作為用戶界面,設(shè)計(jì)人員面臨著多重挑戰(zhàn),既要以盡可能小的功耗和響應(yīng)時(shí)間來實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語音界面 (VUI),又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。為了幫助設(shè)計(jì)人員達(dá)到這些目標(biāo),多家供應(yīng)商推出了一種先進(jìn)的微機(jī)電系統(tǒng) (MEMS) 麥克風(fēng),這種麥克風(fēng)具有多個(gè)性能特征,有助于實(shí)現(xiàn)強(qiáng)大的喚醒詞檢測(cè)和 VUI 語音指令處理。
MEMS 麥克風(fēng)(也稱為硅麥克風(fēng))已普遍在智能手機(jī)、智能手表、無線耳塞、汽車、智能電視以及遙控器中使用。這在很大程度上歸功于大獲成功的個(gè)人語音助手(例如亞馬遜的 Alexa、谷歌語音助手和蘋果的 Siri)。這些助手會(huì)收聽特定的語音指令,使用喚醒詞識(shí)別算法從周圍環(huán)境中提取語音指令。設(shè)計(jì)人員的訣竅是:以經(jīng)濟(jì)高效地的方式快速實(shí)現(xiàn)這種提取功能,同時(shí)盡管存在環(huán)境噪聲,也要提高可靠性、準(zhǔn)確性和遠(yuǎn)場(chǎng)語音采集能力。
本文將討論影響 VUI 設(shè)計(jì)的 MEMS 麥克風(fēng)的關(guān)鍵特性,包括信噪比 (SNR)、動(dòng)態(tài)范圍、靈敏度和啟動(dòng)時(shí)間。然后介紹來自 TDK InvenSense、CUI Devices、STMicroelectronics 和 Vesper Technologies 的硬件和軟件解決方案,并展示如何將其應(yīng)用于語音激活設(shè)計(jì)中。
MEMS 麥克風(fēng)如何工作
一個(gè) MEMS 麥克風(fēng)封裝中通常包含兩個(gè)組件:將聲波轉(zhuǎn)換為電信號(hào)的 MEMS 膜,以及用作阻抗轉(zhuǎn)換器向音頻信號(hào)鏈提供可用模擬輸出的放大器。如果需要數(shù)字輸出,還可在其芯片上再集成一個(gè)組件——模數(shù)轉(zhuǎn)換器 (ADC)。
圖 1:MEMS 麥克風(fēng)的基本結(jié)構(gòu)顯示了其兩個(gè)關(guān)鍵構(gòu)建塊:MEMS 變動(dòng)器和信號(hào)處理鏈(位于 ASIC 中)。(圖片來源:CUI Devices)
除了支持具有模擬或數(shù)字輸出的微型麥克風(fēng)外,MEMS 技術(shù)還實(shí)現(xiàn)了出色的相位匹配和漂移性能。
MEMS 麥克風(fēng)的關(guān)鍵特性
對(duì)于語音控制設(shè)備設(shè)計(jì)人員而言,需要在 MEMS 麥克風(fēng)中查找的關(guān)鍵參數(shù)如下:
• 信噪比 (SNR):這是參考信號(hào)電平與麥克風(fēng)輸出信號(hào)的噪聲電平之比。SNR 測(cè)量值包括麥克風(fēng)元件和 MEMS 麥克風(fēng)封裝中集成的任何其他設(shè)備(例如 IC)產(chǎn)生的噪聲。
靈敏度:響應(yīng) 1千赫 (kHz) 正弦波時(shí)的模擬或數(shù)字輸出值,其聲壓級(jí) (SPL) 為 94 分貝 (dB) 或1 帕斯卡 (Pa),后者為壓力測(cè)量值。
• 靈敏度公差:任何給定的單只麥克風(fēng)的靈敏度范圍。嚴(yán)格的靈敏度公差可在使用多個(gè)麥克風(fēng)時(shí)確保一致性。
• 動(dòng)態(tài)范圍:麥克風(fēng)線性響應(yīng)的最大和最小聲壓級(jí)的差異測(cè)量。
• 頻率響應(yīng):麥克風(fēng)能夠工作的頻率范圍。
• 啟動(dòng)時(shí)間:響應(yīng)觸發(fā)事件時(shí)麥克風(fēng)被喚醒并輸出有效信號(hào)的速度。
諸如遙控器、電視和智能揚(yáng)聲器之類的語音控制設(shè)備通常工作在高環(huán)境噪聲下。同樣,在遠(yuǎn)場(chǎng)操作中,用戶可能在附近或距離 1 至 10 米 (m) 的地方。這些情況使麥克風(fēng)的動(dòng)態(tài)范圍、靈敏度和 SNR 變得如此重要。在陣列中使用多個(gè)麥克風(fēng)的應(yīng)用中,靈敏度公差至關(guān)重要。
雖然可以規(guī)定每個(gè)麥克風(fēng)具有一定的靈敏度水平,但細(xì)微的結(jié)構(gòu)變化可能會(huì)導(dǎo)致各種變更。但是,由于 MEMS 麥克風(fēng)是使用嚴(yán)格控制的半導(dǎo)體制造工藝開發(fā),因此具有匹配嚴(yán)格的靈敏度公差,這是任何麥克風(fēng)陣列進(jìn)行有效數(shù)據(jù)處理所需的(圖 2)。
圖 2:陣列中使用的麥克風(fēng)必須嚴(yán)格匹配才能實(shí)現(xiàn)所需的信號(hào)處理性能。(圖片來源:CUI Devices)
為使支持 VUI 的設(shè)計(jì)能越來越多地采用麥克風(fēng)陣列,緊公差的輔助作用極其重要。在麥克風(fēng)陣列中,由兩個(gè)或多個(gè)麥克風(fēng)收集信號(hào),然后在組合信號(hào)并形成合成信號(hào)之前,分別處理來自每個(gè)麥克風(fēng)的信號(hào)(放大、延遲或?yàn)V波)。在麥克風(fēng)陣列中,可以使用多個(gè)輸入來確定方向響應(yīng)(也稱為波束形成),以濾除不需要的噪聲;與此同時(shí),重點(diǎn)關(guān)注在來自更期望的方向上的聲音。
MEMS 麥克風(fēng)的啟動(dòng)時(shí)間對(duì)于捕獲全部關(guān)鍵詞并確保其準(zhǔn)確性也至關(guān)重要。為了節(jié)電,支持 VUI 的設(shè)備保持低功耗狀態(tài);但是,如果麥克風(fēng)響應(yīng)喚醒觸發(fā)的啟動(dòng)時(shí)間短,則會(huì)影響 VUI 喚醒時(shí)間,進(jìn)而影響喚醒詞檢測(cè)性能以及功耗。
只要在選擇麥克風(fēng)時(shí)考慮到這些特性,那么在具有高環(huán)境噪聲或者用戶遠(yuǎn)距離講話,或者這兩種情形都存在的情況下,后續(xù)的語音處理算法便能夠更好地執(zhí)行用戶語音提取功能。
模擬與數(shù)字 MEMS 麥克風(fēng)接口
正如有關(guān) MEMS 麥克風(fēng)工作原理的部分所述,MEMS 麥克風(fēng)輸出可以采用模擬或者數(shù)字形式。模擬 MEMS 麥克風(fēng)使用內(nèi)部放大器將麥克風(fēng)的輸出信號(hào)驅(qū)動(dòng)至具有低輸出阻抗的合理高電平。這提供了一個(gè)連接音頻處理器的直接接口。對(duì)于 VUI,設(shè)計(jì)人員需要確保相關(guān)處理器具有板載 ADC,或者設(shè)計(jì)人員能夠選擇 ADC 以滿足其特定要求。后者會(huì)增加復(fù)雜性和成本。
借助數(shù)字 MEMS 麥克風(fēng),麥克風(fēng)輸出可直接應(yīng)用于通常的微控制器或數(shù)字信號(hào)處理器 (DSP) 的數(shù)字電路。用于電噪聲環(huán)境的 VUI 設(shè)計(jì)更傾向于數(shù)字麥克風(fēng),因?yàn)榕c模擬輸出信號(hào)相比,數(shù)字輸出信號(hào)具有更高的抗噪能力。
此外,數(shù)字 MEMS 麥克風(fēng)通常采用脈沖密度調(diào)制 (PDM) 將模擬信號(hào)電壓轉(zhuǎn)換為包含相應(yīng)密度的邏輯高信號(hào)的單比特?cái)?shù)字流。這樣可以進(jìn)一步抵御射頻干擾 (RFI) 和電磁干擾 (EMI)。這對(duì)于大型麥克風(fēng)陣列和諸如支持語音的車輛信息娛樂系統(tǒng)之類的實(shí)際大型系統(tǒng)尤其重要。
關(guān)于靈敏度,就模擬麥克風(fēng)而言,是采用以分貝為單位的聲壓級(jí)相對(duì)于 1 伏 (dB/V) 進(jìn)行測(cè)量的。對(duì)于數(shù)字麥克風(fēng),通常以相對(duì)于滿刻度分貝值為單位進(jìn)行測(cè)量 (dB FS) 。
VUI 的 MEMS 麥克風(fēng)解決方案
TDK InvenSense 的 ICS-40740 模擬 MEMS 麥克風(fēng)滿足了 VUI 應(yīng)用的許多關(guān)鍵麥克風(fēng)性能要求。該器件包含一個(gè) MEMS 麥克風(fēng)元件、一個(gè)阻抗轉(zhuǎn)換器和一個(gè)差分輸出放大器,采用小型 4.00 x 3.00 x 1.20 毫米 (mm) 的表面貼裝封裝。該器件采用 1.5 伏電源供電,工作時(shí)僅消耗 165 微安 (µA) 電流(圖 3)。
圖 3:ICS-40740 模擬 MEMS 麥克風(fēng)滿足智能揚(yáng)聲器和可穿戴設(shè)備(例如降噪耳機(jī))的尺寸和功率預(yù)算要求。(圖片來源: TDK InvenSense)
該器件的 SNR 為 70 dBA(A 加權(quán)分貝),并與 108.5 dB 的寬動(dòng)態(tài)范圍相耦合,即使在高環(huán)境噪聲和遠(yuǎn)場(chǎng)條件下也能檢測(cè)到語音信號(hào)。此外,該器件具有 80 赫茲 (Hz) 到 20 kHz 的寬工作頻率響應(yīng)范圍,132.5 dB 的線性響應(yīng)性能和 ±1 dB 靈敏度公差。后者使其對(duì)于麥克風(fēng)陣列非常有用。
ICS-40740 的封裝小、功耗低,使其適用于圍繞智能揚(yáng)聲器和諸如降噪耳機(jī)等可穿戴設(shè)備構(gòu)建的物聯(lián)網(wǎng) (IoT) 應(yīng)用程序。
Vesper Technologies 的 VM3000 是一款全向、底部端口壓電式數(shù)字 MEMS 麥克風(fēng),具有不到 200 微秒 (µs) 的超快速啟動(dòng)時(shí)間,使其被快速喚醒,足以捕獲完整的喚醒詞(圖4)。
圖4:VM3000 壓電式數(shù)字 MEMS 麥克風(fēng)具有不到 200 µs 的超快速啟動(dòng)時(shí)間,使其能夠足被快速喚醒,足以捕獲完整的喚醒詞。(圖片來源:Vesper Technologies)
在壓電式 MEMS 麥克風(fēng)中,當(dāng)聲波撞擊壓電懸臂時(shí),將使懸臂移動(dòng)并產(chǎn)生電壓。該電壓由一個(gè)功耗非常低的比較器電路檢測(cè),該電路會(huì)將喚醒信號(hào)發(fā)送到音頻系統(tǒng)。
由于壓電式 MEMS 麥克風(fēng)不需要偏置電壓,因此 VM3000 在被喚醒詞指令啟動(dòng)前幾乎無功耗。而且,這種麥克風(fēng)僅需 0.35 µA 電流即可保持休眠模式,并且能夠在不到 100 µs 的時(shí)間內(nèi)切換到性能模式。超低功耗休眠模式與快速模式切換相結(jié)合,還能確保在喚醒音頻設(shè)備時(shí)不會(huì)丟失任何信息。
VM3000 數(shù)字麥克風(fēng)幾乎可以與任何音頻芯片配對(duì),其輸出特點(diǎn)是在一條數(shù)據(jù)線上復(fù)用兩個(gè)麥克風(fēng)。該麥克風(fēng)在 1 kHz 信號(hào)下的典型 SNR 為 63 dB,具有 122 dB SPL 聲學(xué)過載點(diǎn) (AOP)。
VM3000 采用 3.5 x 2.65 x 1.3 mm 封裝,并通過集成 ADC 節(jié)省物料清單 (BOM)。此外,VM3000 使用單層壓電晶體,使其不受靈敏度漂移的影響,并可防止灰塵、水、濕氣和其他環(huán)境顆粒的侵害。
諸如 VM3000 之類的壓電式 MEMS 麥克風(fēng)無需使用保護(hù)網(wǎng)或薄膜覆蓋多個(gè)麥克風(fēng),從而簡(jiǎn)化了陣列的音頻設(shè)計(jì)。如保護(hù)網(wǎng)或保護(hù)膜等為防止受環(huán)境污染而覆蓋聲學(xué)孔的保護(hù)元件,可導(dǎo)致 MEMS 麥克風(fēng)靈敏度下降。
VM3000 也相對(duì)容易實(shí)現(xiàn),因?yàn)樗梢灾迸c CODEC 或其他處理器連接(圖 5)。主系統(tǒng)(CODEC 等)提供主時(shí)鐘 CLK,該時(shí)鐘定義了 DATA 線上的比特速率。
圖5:VM3000 可以直接與外部處理器連接,并且可將兩個(gè)麥克風(fēng)連接到一條 DATA 線上。(圖片來源:Vesper Technologies)
有趣的是,兩個(gè)麥克風(fēng)可以通過一條 DATA 線連接。這是因?yàn)閿?shù)據(jù)是在由 L/R Select 引腳定義的時(shí)鐘 (CLK) 上升沿或下降沿設(shè)置的,而 L/R Select = GND(頂部)在時(shí)鐘下降沿設(shè)置數(shù)據(jù),L/R Select = VDD(底部)在時(shí)鐘上升沿設(shè)置數(shù)據(jù)。然后,CODEC 或處理器可以根據(jù)比特流與 CLK 邊沿的對(duì)齊方式將其分離。
入門:MEMS 麥克風(fēng)評(píng)估套件
為了評(píng)估關(guān)鍵參數(shù)并簡(jiǎn)化使用 MEMS 麥克風(fēng)的音頻系統(tǒng)的設(shè)計(jì),供應(yīng)商提供了參考板和軟件開發(fā)套件。例如,Vesper 提供了 S-VM3000-C 評(píng)估板,其中包括一個(gè) VM3000 數(shù)字 MEMS 麥克風(fēng)和一個(gè) 0.1 微法拉 (µF) 的電源旁路電容器以及一個(gè)邊緣連接器。
同樣,TDK InvenSense 為其 ICS-40740 模擬 MEMS 傳感器提供 EV_ICS-40740-FX 評(píng)估板,可讓設(shè)計(jì)人員快速、高效地分析差分模擬輸出麥克風(fēng)的性能。除 MEMS 麥克風(fēng)外,該開發(fā)套件唯一的其他組件便是 0.1 µF 電源旁路電容器。
CUI Devices 同時(shí)提供模擬和數(shù)字 MEMS 麥克風(fēng),其 DEVKIT-MEMS-001 開發(fā)套件用于原型開發(fā)和測(cè)試(圖 6)。該評(píng)估板有四個(gè)獨(dú)立的麥克風(fēng)評(píng)估電路。
圖 6:DEVKIT-MEMS-001 有四個(gè)可拆卸麥克風(fēng)評(píng)估電路:其中兩個(gè)用于模擬輸出,另兩個(gè)用于數(shù)字輸出。(圖片來源:CUI Devices)
該評(píng)估板上有兩個(gè)模擬 MEMS 麥克風(fēng):底部音孔 CMM-2718AB-38308-TR 和頂部音孔 CMM-2718AT-42308-TR;兩個(gè)數(shù)字 MEMS 麥克風(fēng):底部音孔 CMM-4030DB-26354-TR 和頂部音孔 CMM-4030DT-26354-TR。頂部和底部音孔用于模擬和數(shù)字輸出麥克風(fēng),以提高設(shè)計(jì)靈活性。
比較這兩個(gè)模擬設(shè)備,CMM-2718AB-38308-TR 的靈敏度為 -38 dB,SNR 為 65 dBA。CM-2718AT-43208-TR 的靈敏度為 -42 dB,SNR 為 60 dBA。兩者的頻率范圍均為 100 Hz 至 10 kHz,并從 2 V 電源軌汲取 80 µA 電流。
對(duì)于兩個(gè)數(shù)字麥克風(fēng),CMM-4030DB-26354-TR 的靈敏度為 -26 dB FS,SNR 為 64 dBA。CMM-4030DT-26354-TR 的靈敏度為 -26 dB FS,SNR 為 65 dBA。兩者均使用 1 位 PDM 數(shù)據(jù)格式,在 100 Hz 至 10 kHz 頻率范圍內(nèi)工作,并從 2 V 電源汲取 0.54 毫安 (mA) 電流。
總結(jié)
通過仔細(xì)研究 MEMS 麥克風(fēng)(模擬和數(shù)字),可以發(fā)現(xiàn)其系統(tǒng)級(jí)性能優(yōu)勢(shì),以及它們?nèi)绾螌?duì)始終開啟的語音接口設(shè)計(jì)進(jìn)行補(bǔ)充。最新的 MEMS 麥克風(fēng)采用新穎的技術(shù)來延長(zhǎng)電池壽命,改善遠(yuǎn)場(chǎng)音頻質(zhì)量并能抵御環(huán)境污染。提高關(guān)鍵詞的準(zhǔn)確性是另一個(gè)主要的設(shè)計(jì)考慮因素,它與 SNR、靈敏度容差和啟動(dòng)時(shí)間等參數(shù)密切相關(guān)。所有這些都已在最新設(shè)備中得到解決,能更好地適應(yīng) VUI 設(shè)計(jì)。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)聯(lián)系小編進(jìn)行處理。
特別推薦
- 隨時(shí)隨地享受大屏幕游戲:讓便攜式 4K 超高清 240Hz 游戲投影儀成為現(xiàn)實(shí)
- 在發(fā)送信號(hào)鏈設(shè)計(jì)中使用差分轉(zhuǎn)單端射頻放大器的優(yōu)勢(shì)
- 第9講:SiC的加工工藝(1)離子注入
- 移遠(yuǎn)通信再推兩款新型4G、Wi-Fi、GNSS三合一組合天線
- Bourns 推出全新雙繞組系列,擴(kuò)展屏蔽功率電感產(chǎn)品組合
- 貿(mào)澤開售AMD Versal AI Edge VEK280評(píng)估套件
- 安森美Hyperlux圖像傳感器將用于斯巴魯新一代集成AI的EyeSight系統(tǒng)
技術(shù)文章更多>>
- 借助完全可互操作且符合 EMC 標(biāo)準(zhǔn)的 3.3V CAN 收發(fā)器簡(jiǎn)化汽車接口設(shè)計(jì)
- ADALM2000實(shí)驗(yàn):變壓器耦合放大器
- 功率器件熱設(shè)計(jì)基礎(chǔ)(四)——功率半導(dǎo)體芯片溫度和測(cè)試方法
- 采用系統(tǒng)級(jí)模塊方法簡(jiǎn)化精密阻抗分析儀的設(shè)計(jì)
- 在智能照明產(chǎn)品設(shè)計(jì)中實(shí)施Matter協(xié)議的經(jīng)驗(yàn)教訓(xùn)
技術(shù)白皮書下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
電動(dòng)車
電動(dòng)工具
電動(dòng)汽車
電感
電工電路
電機(jī)控制
電解電容
電纜連接器
電力電子
電力繼電器
電力線通信
電流保險(xiǎn)絲
電流表
電流傳感器
電流互感器
電路保護(hù)
電路圖
電路圖符號(hào)
電路圖知識(shí)
電腦OA
電腦電源
電腦自動(dòng)斷電
電能表接線
電容觸控屏
電容器
電容器單位
電容器公式
電聲器件
電位器
電位器接法