ASR語音識別是什么?目前的困境與發(fā)展
文章摘要:早在人類文字誕生之前,語言就作為人們的交流、溝通工具長期存在著,是人類文明交流的重要橋梁和媒介,促進(jìn)著文明的發(fā)展。而到了如今的信息社會,語言仍然是科學(xué)家們研究的重點(diǎn)對象,對語音識別技術(shù)的研究已經(jīng)成為人工智能研究的重點(diǎn)領(lǐng)域。在現(xiàn)階段,語音識別技術(shù)在各行各業(yè)都得到了廣泛的應(yīng)用,通過計(jì)算機(jī)解讀人類語言達(dá)到人機(jī)交互智能化。
早在人類文字誕生之前,語言就作為人們的交流、溝通工具長期存在著,是人類文明交流的重要橋梁和媒介,促進(jìn)著文明的發(fā)展。而到了如今的信息社會,語言仍然是科學(xué)家們研究的重點(diǎn)對象,對語音識別技術(shù)的研究已經(jīng)成為人工智能研究的重點(diǎn)領(lǐng)域。在現(xiàn)階段,語音識別技術(shù)在各行各業(yè)都得到了廣泛的應(yīng)用,通過計(jì)算機(jī)解讀人類語言達(dá)到人機(jī)交互智能化。
一、什么是語音識別
所謂語音識別,簡單地說就是讓機(jī)器聽懂人說話實(shí)現(xiàn)人類語音直接對計(jì)算機(jī)下達(dá)命令,而計(jì)算機(jī)根據(jù)識別和處理語音對命令進(jìn)行執(zhí)行,從而實(shí)現(xiàn)人類與計(jì)算機(jī)的智能交互化,比如我們?nèi)粘I钪惺煜さ腟iri語音助手、天貓智能音響、訊飛語記等產(chǎn)品都是基于語音識別技術(shù)的研究而產(chǎn)生的應(yīng)用。早在20世紀(jì)80年代,語音識別研究人員就把隱馬爾科夫模型(HMM)應(yīng)用于語音識別的研究中,得到了令人滿意的結(jié)果,因此,HMM模型發(fā)展到當(dāng)前時(shí)期,已經(jīng)成為眾多研究人員研究圖形技術(shù),語音識別技術(shù)的重點(diǎn)。
二、語音識別的探索
隨著現(xiàn)代信息技術(shù)的發(fā)展,人類開始重視把人類語言與人工智能進(jìn)行結(jié)合,實(shí)現(xiàn)直接用語音對計(jì)算機(jī)下達(dá)指令的目的,研究語音識別技術(shù)的目的就是用計(jì)算機(jī)解讀人類語言指令,實(shí)現(xiàn)人與計(jì)算機(jī)的智能化交互。而目前能夠?qū)崿F(xiàn)這一目標(biāo)的技術(shù)主要包括對語音進(jìn)行識別的技術(shù),識別之后對語音進(jìn)行編碼的技術(shù),還有對語音進(jìn)行合成的技術(shù)。
三、語音識別目前的困境
語音識別技術(shù)除了需要計(jì)算機(jī)能夠?qū)θ祟愓Z音信息進(jìn)行數(shù)字化的轉(zhuǎn)換,同時(shí)還要準(zhǔn)確執(zhí)行指令,雖然在理論上語音識別研究已經(jīng)取得了不錯(cuò)的成效,但是在實(shí)際應(yīng)用過程中,還存在一些缺陷和不足。
首先是噪聲干擾的問題,人們在對機(jī)器發(fā)出語音指令時(shí),周圍環(huán)境中存在著不同程度的噪音,比如汽車,電視,其他人的說話聲都可能對語音識別產(chǎn)生影響。而對這些噪聲干擾,當(dāng)前的語音識別技術(shù)還沒有發(fā)展出有效的解決方法,對一個(gè)環(huán)境中的多個(gè)語音信息不能夠有效識別出需要識別的語音信號,或者干脆跳過對這段語音信號的識別。其次就是端點(diǎn)檢測的問題,排除掉噪聲干擾的影響,在安靜的環(huán)境中,端點(diǎn)檢測容易對人聲信息的開始和結(jié)束識別不清,導(dǎo)致語音識別過程中把安靜的部分按照靜音處理,丟失掉原有的聲音信息。
四、沃豐科技ASR語音識別的優(yōu)勢
基于自研原心引擎語音語義融合方案,打通業(yè)務(wù)領(lǐng)域數(shù)據(jù),實(shí)現(xiàn)業(yè)務(wù)定制化的效果體驗(yàn),自然場景識別率超過95%,個(gè)性化詞匯識別超過97%,同時(shí)為語義模塊提供豐富的識別結(jié)果輸出,使語義識別率提升5個(gè)點(diǎn)以上采用國際前沿的端到端語音語義一體化建模算法,將語音快速準(zhǔn)確識別為文字,支持一句話識別、語音內(nèi)容分析、機(jī)器人對話、智能質(zhì)檢等多個(gè)場景。
》》點(diǎn)擊免費(fèi)試用asr平臺,優(yōu)勢一試便知
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/faq/36553
ASR語音識別智能語音識別語音識別技術(shù)優(yōu)勢
