智能語(yǔ)音機(jī)器人今后的發(fā)展方向
文章摘要:到目前為止,智能語(yǔ)音機(jī)器人這一產(chǎn)品大約經(jīng)歷了三代人。第一代,以IVR為主(InteractiveVoiceResponse,也就是交互式語(yǔ)音應(yīng)答),大家以前都接到過(guò)銀行或客戶服務(wù)電話。例如,在一句開(kāi)場(chǎng)白之后,讓您選擇:...
到目前為止,智能語(yǔ)音機(jī)器人這一產(chǎn)品大約經(jīng)歷了三代人。
第一代,以 IVR為主(Interactive Voice Response,也就是交互式語(yǔ)音應(yīng)答),大家以前都接到過(guò)銀行或客戶服務(wù)電話。例如,在一句開(kāi)場(chǎng)白之后,讓您選擇:按下一或二鍵,相當(dāng)于第一代交互機(jī)器人的操作方式。
在2017年至2019年的兩到三年內(nèi),隨著深度學(xué)習(xí)算法的迅速普及和發(fā)展,實(shí)時(shí)對(duì)話機(jī)器人將會(huì)出現(xiàn)。電話那頭的顧客可能感覺(jué)不到什么特別明顯的東西,但細(xì)聽(tīng)的話也能聽(tīng)到是機(jī)器人。每個(gè)人都會(huì)接到一些電話,聊天中才發(fā)現(xiàn)這是一個(gè)機(jī)器人。這類機(jī)器人一般對(duì)話能力相對(duì)比較簡(jiǎn)單,一般聊天幾輪或30秒左右就結(jié)束,只做簡(jiǎn)單的任務(wù)。
直到今天,未來(lái)幾年都是下一代機(jī)器人,以前更多的還是要學(xué)習(xí)人類的能力,而現(xiàn)在,下一代機(jī)器人主要是做決定。
智能機(jī)器人想要工作,主要從三個(gè)方面來(lái)學(xué)習(xí)人類的能力。
首先是語(yǔ)言。一般情況下,任何場(chǎng)景下機(jī)器人使用的語(yǔ)言,首先都要有人工,客戶服務(wù)中心積累語(yǔ)料,正常的人和用戶交談,看他怎么說(shuō)話。無(wú)論客戶服務(wù)、電銷還是其他場(chǎng)景,人工客服和用戶如何交談,都是聊天的內(nèi)容,說(shuō)話的方式。
其次是聲音,機(jī)器人的上代產(chǎn)品更多地使用了 TTS (Text To Speech)語(yǔ)音合成技術(shù)。事實(shí)上,里有各種各樣的智能音響,你去問(wèn)問(wèn)題,它在為你播放東西的時(shí)候,就是在進(jìn)行語(yǔ)音合成,你可以聽(tīng)出合成的效果。里面的一些聲音,語(yǔ)調(diào),音色和真實(shí)的人還是有些不同的。
如今,市場(chǎng)上所有的語(yǔ)音合成,包括國(guó)內(nèi)的中文語(yǔ)音合成,只要聽(tīng)得細(xì)一點(diǎn)就能聽(tīng)到。第一,語(yǔ)音合成的聲音多會(huì)比較平坦。第二,里面沒(méi)有情緒,很多情緒都聽(tīng)不見(jiàn)。因此,下一代機(jī)器人聲音必須更接近于人工音效,或使人工音效變平。
關(guān)鍵在于做決定,因?yàn)槿藗冊(cè)趯?duì)話中,除了聽(tīng)和說(shuō)這些能力外,大腦還會(huì)理解對(duì)方想要表達(dá)什么。就像另一個(gè)人說(shuō)的話,我心里一定會(huì)想,他說(shuō)的話到底是什么意思。在我了解這個(gè)句子的意思后,我還會(huì)考慮怎樣回答他。當(dāng)我回答他的問(wèn)題和意圖時(shí),我一定會(huì)帶著自己的目的。根據(jù)我的目的,腦子里想一個(gè)字,想完了,這個(gè)字就會(huì)說(shuō)出來(lái)。實(shí)際上是這樣的一個(gè)過(guò)程。制作一個(gè)機(jī)器人,首先要了解過(guò)去的人如何與用戶交談。
在過(guò)去的幾年里,每個(gè)人的決策都做得很簡(jiǎn)單,后臺(tái)人工通過(guò)拖拽的方式,配上一段對(duì)話的邏輯出來(lái)。但這完全是基于人的體驗(yàn),如果用戶表達(dá)的內(nèi)容不在邏輯圈內(nèi),跳出來(lái),機(jī)器人就不知道該如何回答。
從后面看,智能語(yǔ)音機(jī)器人做出決定的能力跟在人類后面,可能是10年,20年,甚至更久。事實(shí)上,從現(xiàn)在起,我們就要采取行動(dòng)了。
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來(lái)源:http://www.yzny.net.cn/ucm/faq/13390
對(duì)話機(jī)器人智能對(duì)話機(jī)器人
