智能對話機器人系統(tǒng)由三部分構(gòu)成:ASR、NLP、TTS
文章摘要:一個完整的智能語音對話機器人系統(tǒng)主要由自動語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)三部分構(gòu)成,這三部分技術(shù)保障了語音系統(tǒng)的精準(zhǔn)、高效、穩(wěn)定運行,被稱之為語音交互的“三駕馬車”。
一個完整的智能語音對話機器人系統(tǒng)主要由自動語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)三部分構(gòu)成,這三部分技術(shù)保障了語音系統(tǒng)的精準(zhǔn)、高效、穩(wěn)定運行,被稱之為語音交互的“三駕馬車”。
1)語音識別(ASR)
語音識別能夠?qū)⒂脩舻恼Z音轉(zhuǎn)換成文字。針對語音識別應(yīng)用中面臨的方言口音、背景噪聲等問題,在實際業(yè)務(wù)系統(tǒng)中所收集的涵蓋不同方言和不同類型背景噪聲的海量語音數(shù)據(jù)的基礎(chǔ)上通過先進(jìn)的區(qū)分訓(xùn)練方法進(jìn)行語音建模,能夠使語音識別在復(fù)雜應(yīng)用場景下均有良好的效果表現(xiàn)。在檢測語音過程中,語音活性檢測 (VAD)語音端點檢查,使用音頻特征等進(jìn)行分析,確定人聲的開始和結(jié)束時間點。
2)自然語言處理(NLP)
自然語言處理狹義上講包括自然語義理解(NLU)和自然語言生成(NLG)兩個方面,前者是指將人類語言轉(zhuǎn)化為標(biāo)注的機器語言,后者則是指將機器語言轉(zhuǎn)化為人類語言。在龐大復(fù)雜的漢語體系里,NLP幫助產(chǎn)品正確理解人們想要表達(dá)的意思,并給出合理的反饋。NLP是語音產(chǎn)品的關(guān)鍵,也是主要難點。
3)語音合成(TTS)
語音合成能夠?qū)⑤斎胛谋緦崟r轉(zhuǎn)換成流暢、清晰、自然、具有表現(xiàn)力的語音數(shù)據(jù),輸出高質(zhì)量的語音。
智能對話機器人根據(jù)客戶的意圖進(jìn)行智能應(yīng)答,語音識別迅速,能夠準(zhǔn)確判斷出是否為意向客戶,將客服人員從重復(fù)、機械的初步篩選、意向識別中解放出來,投入到更有價值的客戶中。傳統(tǒng)外呼的人力成本和管理成本高,業(yè)務(wù)質(zhì)量無法保證,管理復(fù)雜,因此機械、重復(fù)、枯燥的電話撥打任務(wù)都可以交給智能語音機器人輔助完成。
》》點擊免費試用智能語音機器人,優(yōu)勢一試便知
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/faq/38035
