從ASR技術層面上來說,智能客服不智能的原因在哪里?
文章摘要:“我要找人工客服!”“對不起,小智聽不懂你的問題,您是想要咨詢訂單進度嗎?”“我要找人工客服??!”“對不起,小智聽不懂你的問題,您是想要咨詢訂單進度嗎?”“。。我買的衣服沒剪吊牌,但是不小心...
“我要找人工客服!”
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進度嗎?”
“我要找人工客服!!”
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進度嗎?”
“。。我買的衣服沒剪吊牌,但是不小心劃了一下,沒破,有個印子,還能退貨嗎?”
“關于退貨問題,您只需要在訂單也點擊退貨選項即可,我家支持7天無理由退貨哦~”
“那衣服被劃了一道,還能退嗎?”
“關于退貨問題,您只需要在訂單也點擊退貨選項即可,我家支持7天無理由退貨哦~”
“。。你不是小智,你是個小智障吧”
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進度嗎?”
這個場景是不是似曾相識?是不是你說啥,智能客服都聽不懂,回答的驢唇不對馬嘴。然后想找人工客服,死活找不到入口,最后浪費半小時,除了把自己氣的半死外,啥問題都沒解決。
不僅這一個問題讓人抓狂,智能客服想找到對應問題解答區(qū)間同樣十分費勁,因為這需要客戶一直按照提示音,點點點。這浪費了大量時間,等找到問題解決辦法了,黃花菜都涼了。到底是人性的毀滅還是道德的淪喪,讓這樣的事情頻頻發(fā)生在我們身上,智能客服為啥就變成了智障客服呢?問題到底出在哪?
要想知道這個原因,首先我們需要搞清楚人工智能客服的商業(yè)模式。目前市場上主要的商業(yè)模式分為兩種:一種是定制化模式,智能客服供應商根據企業(yè)自身業(yè)務需求進行靈活、定制化開發(fā),可以更加精準地解決用戶在咨詢過程的問題。當然價格也相應更高,一套定制化智能客服系統(tǒng)的價格在幾十萬到上百萬之間,可以買的起的企業(yè)自然都是資金流充足的大型企業(yè);第二種是智能客服供應商在云端給企業(yè)開通智能客服賬戶,公用一套通用模版,定制化程度低,一個賬戶的年費用在千元至萬元不等。像一些中小型企業(yè)受限于資金問題,會選擇這個模式,這也就導致了識別不精確,步驟繁瑣等問題頻出。
智能客服核心應用技術之ASR
但“智能客服不智能”這個問題不能光歸咎于企業(yè)沒錢買不起貴系統(tǒng)上,其中也存在一些技術層面上的問題,比如在ASR( Automatic Speech Recognition),即語音識別技術上存在的問題。
語音識別的一般流程為根據輸入的語音,提取語音特征,通過解碼器融合訓練好的語言模型和聲學模型,得到最終的詞序列結果。字典的作用根據聲學模型識別出來的音素(漢語中一般為聲韻母),來找到對應的漢字(詞)或者單詞,用來在聲學模型和語言模型建立橋梁,將兩者聯(lián)系起來。其中各類模型具體作用分別是:
1、?聲學模型:描述在給定詞的情況下,對應聲學信號的概率。
2、語言模型:描述語言序列關系的模型,關注序列產生的概率。
3、解碼器:根據聲學模型和語言模型,搜索出最有可能的詞序列,其本質是一個動態(tài)規(guī)劃算法。
在語音識別過程中,總會遇到各種問題,在你咨詢智能客服,其回答“抱歉,我聽不懂您在說什么”或者“不好意思,請您再重復一遍”時,就表示對話失敗,ASR沒有成功識別。
而導致ASR識別失敗的原因大多出于以下三點:
1、噪音問題
在實際應用中,用戶在與語音機器人溝通的過程中,所處的空間是具備多樣性的。比如顧客在地鐵上、超市中等戶外場景咨詢時,周邊人聲噪音就會對語音識別造成影響,又比如外賣員、快遞員在送貨的過程中,風聲、喇叭聲、行駛聲等,一樣會對語音識別造成影響。
2、口音問題
口音問題則包含方言以及口音不準的問題,正所謂“十里不同音,百里不同俗”。我國幅員遼闊,擁有五大語系,共有80種以上細分語言。各方言區(qū)內,又分布著若干次方言和許多種土語,語言隔閡難以解除,口音也很難糾正。語言識別無疑是十分困難的事情。
3、實體識別
通俗來說,語音識別模型就是一個概率模型,當語音傳入語音識別模型中,輸出為日常生活中常用到的詞語與句子的概率是高于其他稀疏詞的。而人名、地名、機構名、專有名詞、藥名等均屬于稀疏詞,企業(yè)不常用到,所以在對特定詞語的識別上就會十分困難。
目前應用的前沿技術是什么?(以沃豐科技相關技術為例)
1、垂直領域數據訓練
相較于通用數據,沃豐科技專注于客服領域,已經為超過60家世界500強、200家中國500強客戶提供服務,沉淀了大量可用于模型訓練的客服數據,能夠支撐沃豐科技對模型進行深度的優(yōu)化。
2、端到端技術方案
與BAT企業(yè)相比,沃豐科技率先完成了從pipeline到端到端到技術改進,能將輸入語音直接進行轉化,而傳統(tǒng)pipeline串聯(lián)過程中會有信息的遺失,信息轉化,轉化鏈路長。端到端的技術則轉化鏈路短、速度快,目前沃豐科技在這一過程中也實現了模型深度優(yōu)化。
3、語言與聲學模型結合
熱詞優(yōu)化方面,行業(yè)內對詞語進行少量優(yōu)化的情況下,都會用熱詞的方案,比如優(yōu)化姓名、地址、藥名等無實際意義且不常見的詞,但這種詞用傳統(tǒng)的語言模型的方式或者熱詞方式是無法解決的。而沃豐科技通過語言模型與聲學模型結合的方式解決了這種問題,大幅提升了準確率。
通過上述方式,沃豐科技GaussMind語音識別技術達到了行業(yè)中較好的水平,識別率可達95%,同時能夠實現語音實時轉寫,邊接收語音,邊返回文字;識別效果優(yōu)化,個性化準確率提升。
客戶實踐案例
96123 是北京地鐵服務熱線,于2021年3月31日上線試運行,業(yè)務范圍覆蓋北京城市軌道交通全路網范圍內的運營、票務和站內服務等相關信息咨詢等服務,如乘車線路,票價查詢等日常乘坐軌道交通伴隨的問題。
痛點問題
1.日常咨詢量較大,人工處理工單量大、工單流轉效率有待提升
2.環(huán)境噪音、背景噪音及高地鐵站名稱相似度,數字與漢字并存,給語音識別帶來挑戰(zhàn)
3.北京作為首都,人員范圍廣,五湖四海的人群口音給語音識別帶來難度
4.用戶表達多樣性高,路線信息語義識別困難
解決方案
全面定制化:沃豐科技基于自研的GaussMind“原心引擎”進行全面定制化操作,快速、高效地打造96123智能語音機器人。
ASR(自動語音識別):“聽清”用戶說的“是什么”,準確識別來自五湖四海的口音
NLP(自然語言處理):“聽懂”用戶說的是“什么意思”,準確理解出發(fā)地、目的地
對接業(yè)務系統(tǒng):為用戶快速提供查詢結果信息,讓北京地鐵出行查詢更加智能、便捷。
更多關于ASR技術資訊以及相關案例可點擊下圖咨詢~
文章為沃豐科技原創(chuàng),轉載需注明來源:http://www.yzny.net.cn/ucm/report/23322
ASRASR語音識別智能客服智能語音識別語音識別語音識別技術
