乱码精品一卡二卡无卡,亚洲欧美综合精品成人网,真人性囗交69视频,天天摸天天碰天天弄天天爽,又色又爽又爽黄的视频免费

沃豐科技AI技術(shù)干貨 | ASR技術(shù)聚焦垂直場景 助力業(yè)務(wù)增長

作者:人工智能 1455文章閱讀時間:4分鐘

文章摘要:目前,ASR技術(shù)已經(jīng)被越來越多的行業(yè)應(yīng)用,并深入到了各個維度的使用場景。最初ASR的應(yīng)用領(lǐng)域是廣泛而通用的,但隨著行業(yè)發(fā)展,各廠商逐漸把目光聚焦在了垂直領(lǐng)域,以沃豐科技為代表的人工智能公司,開始挖掘更聚焦的ASR技術(shù)應(yīng)用形態(tài),將通用語音識別轉(zhuǎn)化為垂直場景的語音識別,從而大幅度提升識別準確率和行業(yè)適配性。

沃豐科技

ASR(Automatic Speech Recognition)即自動語音識別技術(shù),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入數(shù)據(jù)。2010年,機器學(xué)習(xí)算法和計算機性能的進步帶來了更有效的訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的方法,2020年以后,隨著一些端到端技術(shù)的更新,技術(shù)優(yōu)勢被逐漸完善。
目前,ASR技術(shù)已經(jīng)被越來越多的行業(yè)應(yīng)用,并深入到了各個維度的使用場景。最初ASR的應(yīng)用領(lǐng)域是廣泛而通用的,但隨著行業(yè)發(fā)展,各廠商逐漸把目光聚焦在了垂直領(lǐng)域。因為在不知道上下文背景,沒有具體應(yīng)用領(lǐng)域的情況下,語音識別會變得困難,無法保證準確率。因此,以沃豐科技為代表的人工智能公司,開始挖掘更聚焦的ASR技術(shù)應(yīng)用形態(tài),將通用語音識別轉(zhuǎn)化為垂直場景的語音識別,從而大幅度提升識別準確率和行業(yè)適配性。

“?!弊鼍?/h3>

進行垂直領(lǐng)域模型優(yōu)化

以家電行業(yè)客戶奧克斯為例,沃豐科技AI場景落地專家GaussMind為其打造的語音機器人解決方案,就是ASR在垂直場景下實現(xiàn)地址優(yōu)化的典型案例。奧克斯的服務(wù)場景是空調(diào)售后的上門維修和安裝,其中涉及大量的地址識別,大量的地名是專有名詞,不具有物理意義,并且存在多音字、同音字等現(xiàn)象,這就導(dǎo)致ASR通用模型的執(zhí)行效果不理想,而基于垂直行業(yè)做的專有模型就能夠?qū)崿F(xiàn)精準識別、有的放矢。
奧克斯語音機器人解決方案中的模型訓(xùn)練數(shù)據(jù)來源有兩個,第一個是奧克斯歷史沉淀的留存信息,如用戶調(diào)查填寫,另一個是系統(tǒng)根據(jù)官網(wǎng)訂單自動抓取的信息?;谶@些數(shù)據(jù),沃豐科技在傳統(tǒng)通用模型的基礎(chǔ)上,增加了純地址模型。常規(guī)信息通過通用模型識別,地址信息在地址模型里做識別,為地址這個“老大難”實行小范圍、針對性的識別,最終大大提升了識別的整體準確率。

“精”準執(zhí)行

實時聽寫與錄音文件轉(zhuǎn)寫

在完成語音的準確識別后,系統(tǒng)要根據(jù)識別結(jié)果進行下一步的轉(zhuǎn)寫。ASR技術(shù)的轉(zhuǎn)寫通常分實時聽寫和錄音文件轉(zhuǎn)寫,沃豐科技根據(jù)這兩個場景的特性,分別應(yīng)用了語音機器人和智能質(zhì)檢產(chǎn)品。
在人與人日常的對話中,對話間隔往往在1秒以內(nèi),才能夠保持交流暢通,人機對話同理。如果語音識別時間過久,會嚴重影響用戶的交互體驗。沃豐科技ASR實時聽寫能夠邊解碼邊輸出結(jié)果,將語音機器人交互延時壓縮到800毫秒(0.8秒)左右,確保機器人與客戶對話高效、順利地進行。然而,控制識別速度,意味著轉(zhuǎn)寫效果會有一定折扣。所以在實效性要求不高如智能質(zhì)檢場景下,業(yè)務(wù)反饋時間可適度延長。
此外,沃豐科技采用更大的AI模型,輔以注釋以及二次解碼等策略,幫助企業(yè)生成準確的質(zhì)檢報告,并按時回傳。

“巧”妙攻克難點

優(yōu)化知識效果

自動語音識別技術(shù)的難點,主要在于輸入語音不標準。例如各地人群的口音不同、不同人普通話水平參差不齊,抑或受噪音影響,如外賣小哥邊騎車邊打電話、嘈雜的室外環(huán)境等等。針對這些問題,沃豐科技依托客戶服務(wù)領(lǐng)域多年的行業(yè)積累,根據(jù)大量真實的交互數(shù)據(jù),以場景落地為前提,專門為企業(yè)客戶做行業(yè)垂直模型的開發(fā),最大化地提升語音識別技術(shù)的應(yīng)用效果。
除此之外,生僻詞也是一大技術(shù)難點。這主要體現(xiàn)在人名、地名、藥品名等,這類詞出現(xiàn)頻率低,使用場景也較為稀疏,通過傳統(tǒng)的語言模型和文本方式難以解決。針對這一情況,沃豐科技采用了語言模型與聲學(xué)模型結(jié)合的方式,大大提升了識別準確率。
沃豐科技長期專注于AI技術(shù)研發(fā)與場景落地,特別是在ASR應(yīng)用方面有深厚積累。在越來越多的行業(yè)探索、案例實踐中,沃豐科技的ASR技術(shù)已逐漸成熟,并形成可落地、有跡可循的行業(yè)及標桿案例經(jīng)驗,將ASR技術(shù)及產(chǎn)品廣泛應(yīng)用到各行業(yè)的客戶實踐中。未來,沃豐科技將基于行業(yè)成功案例,進行更多的ASR、NLP等AI技術(shù)應(yīng)用的拓展延伸,為企業(yè)的業(yè)務(wù)優(yōu)化、業(yè)績增長創(chuàng)造出更多的可能性。

》》點擊免費試用語音識別系統(tǒng),優(yōu)勢一試便知

語音識別系統(tǒng)

文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/report/26863

ASR技術(shù)語音交互語音識別語音識別系統(tǒng)

上一篇: 下一篇:

數(shù)字化轉(zhuǎn)型

沃豐科技AI技術(shù)干貨 | ASR技術(shù)聚焦垂直場景 助力業(yè)務(wù)增長的相關(guān)推薦

最新文章推薦

展開更多
?

手機登錄下載

?

使用手機登錄賬號,免費下載白皮書

?
手機登錄