【導(dǎo)讀】在汽車智能化時代,語音操作逐漸成為標(biāo)準(zhǔn)配置。但通常在使用空調(diào)或打開車窗的時候,受到周圍噪聲的影響,語音操作實現(xiàn)起來并不順利。這里詳解一種噪聲去除技術(shù),可大幅提高車載系統(tǒng)語音操作的精確度。
在汽車智能化時代,語音操作逐漸成為標(biāo)準(zhǔn)配置。但通常在使用空調(diào)或打開車窗的時候,受到周圍噪聲的影響,語音操作實現(xiàn)起來并不順利。近日,NEC宣布研發(fā)出了一種噪聲去除技術(shù)可大幅提高車載系統(tǒng)語音操作的精確度。
據(jù)了解,該技術(shù)是利用兩個麥克風(fēng)吸收聲源,再經(jīng)過兩個步驟做雜音處理,啟用聲音模型使設(shè)備更容易識別。通過這項技術(shù),即使處在比原來嘈雜5倍的雜音環(huán)境中也可以完成正確的語音操作。
這項技術(shù)的具體處理步驟為,首先,通過對空調(diào)等車內(nèi)特有噪聲源的位置以及聲音向車內(nèi)麥克風(fēng)傳播的方式進行分析,將兩個麥克風(fēng)按小間距的方式,前后配置在車內(nèi)的最佳位置。這樣就能夠準(zhǔn)確識別來自汽車前方的噪聲和說話者的語音,從而提高去除噪聲的效率。
其次,對檢測到的語音和噪音,分兩次進行雜音處理。先利用進入兩個麥克風(fēng)的噪音的波形類似性,準(zhǔn)確捕捉隨時間變化的噪聲的波形,抽取主要的噪聲成分,接著再利用兩個麥克風(fēng)里的語音相關(guān)性進一步消除噪聲,通過這樣的處理,大部分噪聲都被去除了。
最后,由于在去噪過程中,可能存在語音失真,從而導(dǎo)致車載系統(tǒng)難以識別,NEC公司還開發(fā)了兩個語音模型來進行調(diào)整。具體而言,就是先將語音成分及其變化進行模型化,然后讓失真的語音在兩個模型中自動選擇,最終調(diào)整為易于識別的語音。