化工行業(yè)需要語音識(shí)別嗎?
文章摘要:語音識(shí)別的本質(zhì)是一種基于語音特征參數(shù)的模式識(shí)別,即通過學(xué)習(xí),系統(tǒng)能夠把輸入的語音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。
你了解語音識(shí)別嗎?
語音識(shí)別的本質(zhì)是一種基于語音特征參數(shù)的模式識(shí)別,即通過學(xué)習(xí),系統(tǒng)能夠把輸入的語音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。
目前,模式匹配原理已經(jīng)被應(yīng)用于大多數(shù)語音識(shí)別系統(tǒng)中。一般的模式識(shí)別包括預(yù)處理,特征提取,模式匹配等基本模塊。首先對輸入語音進(jìn)行預(yù)處理,其中預(yù)處理包括分幀,加窗,預(yù)加重等。其次是特征提取,因此選擇合適的特征參數(shù)尤為重要。常用的特征參數(shù)包括:基音周期,共振峰,短時(shí)平均能量或幅度,線性預(yù)測系數(shù)(LPC),感知加權(quán)預(yù)測系數(shù)(PLP),短時(shí)平均過零率,線性預(yù)測倒譜系數(shù)(LPCC),自相關(guān)函數(shù),梅爾倒譜系數(shù)(MFCC),小波變換系數(shù),經(jīng)驗(yàn)?zāi)B(tài)分解系數(shù)(EMD),伽馬通濾波器系數(shù)(GFCC)等。在進(jìn)行實(shí)際識(shí)別時(shí),要對測試語音按訓(xùn)練過程產(chǎn)生模板,最后根據(jù)失真判決準(zhǔn)則進(jìn)行識(shí)別。
語音識(shí)別的場景有很多
在智能出行方面,AI語音技術(shù)也是有很大的用處,而且在車載領(lǐng)域存在剛需。
在智能家居方面,AI語音技術(shù)使我們的智能家電越來越好用。這種AI語音智能技術(shù)為生活?yuàn)蕵樊a(chǎn)品的應(yīng)用操作帶來了極大的便利。
在智能教育方面,AI語音技術(shù)可以作為課堂質(zhì)量輔助和線上虛擬兩部分。語音測評和人機(jī)對話技術(shù)結(jié)合語義技術(shù)應(yīng)用到普通話、古詩詞及外語教學(xué)中,可以快速糾正發(fā)音韻律及語法錯(cuò)誤,并且逐漸被應(yīng)用到考試場景中。
在智能醫(yī)療方面,AI語音技術(shù)幫助醫(yī)院和醫(yī)療機(jī)構(gòu)提高了醫(yī)療服務(wù)的質(zhì)量。
化工行業(yè)在企業(yè)運(yùn)營過程中也需要語音識(shí)別技術(shù)來加持
語音識(shí)別典型應(yīng)用案例
現(xiàn)在幾乎所有的主流輸入法都支持語音輸入。比如說搜狗輸入法,訊飛輸入法,百度輸入法等等。你在使用這些輸入法的時(shí)候按住空格鍵,然后對著麥克風(fēng)說話,輸入法就會(huì)自動(dòng)的把你說的每一句話,每一個(gè)詞每一個(gè)字都轉(zhuǎn)化成文字。如果你的普通話說的非常標(biāo)準(zhǔn)的話,你會(huì)發(fā)現(xiàn)你在手機(jī)上的打字效率變得非常之高,甚至超越了你在電腦上的打字速度。
》》點(diǎn)擊免費(fèi)試用asr平臺(tái),優(yōu)勢一試便知
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/faq/36621
