萬億參數(shù)時代,AI大模型在智能客服領(lǐng)域的應(yīng)用
文章摘要:沃豐科技GaussMind作為人工智能客服領(lǐng)域的領(lǐng)航者,已經(jīng)在AI大模型方面取得重大進展。沃豐科技GaussMind緊跟前沿技術(shù)腳步,將AI大模型應(yīng)用到了智能客服領(lǐng)域,在相似問題推薦、情緒識別等領(lǐng)域取得了重要成果。
當前,世界人工智能技術(shù)進入“第三浪”,正經(jīng)歷突飛猛進的發(fā)展。從業(yè)界角度,在過去的2021 年如果要選一個年度行業(yè)關(guān)鍵詞,非 "大模型"莫屬。AI大模型依靠巨量的訓練數(shù)據(jù),大大提高了人工智能的通用性,其強大的能力令人贊嘆。
沃豐科技GaussMind作為人工智能客服領(lǐng)域的領(lǐng)航者,已經(jīng)在AI大模型方面取得重大進展。沃豐科技GaussMind緊跟前沿技術(shù)腳步,將AI大模型應(yīng)用到了智能客服領(lǐng)域,在相似問題推薦、情緒識別等領(lǐng)域取得了重要成果。
參數(shù)量從1750億到1.6萬億
AI大模型已經(jīng)成為了人工智能領(lǐng)域新的高地,只用了一年多的時間,AI大模型瘋狂迭代,技術(shù)不斷突破。參數(shù)量級從千億、萬億,迅速躍遷到10萬億級別。各大科技巨頭,爭相進入賽道,角逐日漸激烈。
2020年6月,在訓練約2000億個單詞后,模型規(guī)模達到 1750 億參數(shù)、被業(yè)界大咖稱為“史上最強大AI模型”的GPT-3一炮而紅。寫小說、編劇本、敲代碼……GPT-3無所不能。2021年1月,谷歌提出了自己的模型,聲稱參數(shù)量提高到1.6萬億。在計算資源相同情況下,訓練速度大大提升。隨后,華為、阿里等國內(nèi)廠商也先后推出了自己的大模型。
大模型預訓練模型
前沿廠商AI大模型的應(yīng)用示范
一直以來,前沿技術(shù)如何與實際結(jié)合,發(fā)揮應(yīng)有的商業(yè)和社會價值,都是行業(yè)內(nèi)的重點難點,AI模型亦是如此。如何能讓模型更好地適配場景,困擾著諸多的巨頭與業(yè)內(nèi)專家。雖然大模型仍處于探索期,但一線廠商借助大模型的優(yōu)勢、資深行業(yè)經(jīng)驗,依然給出了精彩的應(yīng)用示范。
其中,華為云“盤古”推出了藥物分子大模型,實現(xiàn)了全流程AI輔助藥物設(shè)計;智能電力巡檢場景用無人機代替人工進行缺陷檢測;智源“悟道”大模型助力北京冬奧會手語翻譯播報;還有智能居家、智能車載、智能設(shè)計等等。
大模型已經(jīng)可以在能源、醫(yī)療、物流、金融等100多個場景實際應(yīng)用,為企業(yè)效率提升做出了重要貢獻。但在智能客服領(lǐng)域,大模型的落地并不十分順利。作為智能客服領(lǐng)域領(lǐng)頭羊,沃豐科技GaussMind一直在思考,是什么制約著大模型的應(yīng)用?大模型能夠為智能客服帶來怎樣的改變?沃豐科技GaussMind以切身實踐,著力探索大模型在行業(yè)內(nèi)的應(yīng)用之路。
AI大模型的技術(shù)優(yōu)勢明顯
在模型結(jié)構(gòu)趨于穩(wěn)定的情況下不斷實現(xiàn)精度突破
優(yōu)秀的推理能力是模型增大最為突出的優(yōu)勢。沃豐科技GaussMind在基礎(chǔ)AI能力之上,通過對大模型的使用,在語音技術(shù)噪聲問題、口音問題、鈴聲問題,自然語言處理的動態(tài)場景元素缺失問題、語義深度推理問題、多意圖理解問題等方面都有了不同程度的提升。沃豐科技GaussMind通過模型推理+人工的方式,產(chǎn)出了一批更優(yōu)質(zhì)、更具有溫度的機器人答案。同時我們也在研究、改進模型,業(yè)務(wù)與研發(fā)齊頭并進。
圖像和自然語言處理任務(wù)隨著模型的更迭,準確率持續(xù)突破
減少對數(shù)據(jù)標注的要求
標注數(shù)據(jù)一直是制約模型效果的難題,人工標注數(shù)據(jù)費時費力。大模型擁有自監(jiān)督的學習方法,可以很大程度減輕對標注數(shù)據(jù)的依賴。尤其是面對小樣本數(shù)據(jù)時,數(shù)據(jù)量不足的問題就更加突出。以往的小樣本效果都不盡人意,我們在嘗試大模型后,依靠少量標注數(shù)據(jù)就可以達到不錯的效果,提高效果的同時極大程度地減輕了人工壓力。
為下游任務(wù)提供預訓練方案
AI模型研發(fā)成本極高,很難滿足市場定制化需求。于是大模型提供了一種“預訓練+下游微調(diào)”的模式。沃豐科技GaussMind以大模型為中心,去適應(yīng)特定領(lǐng)域的業(yè)務(wù),極大地提高了模型的泛化能力。
大模型落地的難點
成本過高
有趣的是,在GPT-3的論壇中,有一個非常扎心的標簽:“炫富”。
以紅極一時,家喻戶曉的BERT模型來說,訓練一次的成本大概要1.2萬美元,GPT-2的成本大概是BERT的3-4倍。而GPT-3的參數(shù)量是GPT-2的100倍,訓練成本估計在千萬美元之上。這個數(shù)字,對于很多公司是遙不可及的,更不用說最新的模型參數(shù)已經(jīng)遠不是GPT-3的數(shù)量級了,所需經(jīng)費已經(jīng)成為了天文數(shù)字。
同時,大模型的能力并沒有強大到讓人忽略成本。一些任務(wù)量小的場景,一味依賴模型,只會造成資源浪費,如“大炮打蚊子”。如何在控制成本與提升效率、提高客戶滿意度中權(quán)衡,成為了大模型落地智能客服的關(guān)鍵問題。
響應(yīng)耗時長
經(jīng)過對大模型接口的測試,僅僅是Q&A問答接口,平均響應(yīng)時間就要到2min,創(chuàng)作圖片的接口響應(yīng)時間在3-5min,一些復雜功能接口的響應(yīng)時間到了十幾分鐘。智能客服產(chǎn)品,對線上的問答要求在毫秒級。很顯然,這樣的時耗在匹配線上要求時效性的場景時顯然是不能滿足的。
大模型在智能客服領(lǐng)域的應(yīng)用實踐
情緒識別
沃豐科技GaussMind基于ALBERT、悟道GLM模型在客服情感識別方面進行了驗證,其中訓練數(shù)據(jù)10w條,驗證集和測試集均1w條。
從上表中可以看出,預訓練大模型ALBERT和悟道GLM模型相比傳統(tǒng)的深度學習模型TextCNN準確率和召回率都有巨大的提升,而模型更大的悟道GLM相對效果更好一點。
相似問題生成
大模型雖然受限于響應(yīng)時長無法用于實時的問答服務(wù),但是其強大的生成能力,為智能客服的發(fā)展提供了另外一條道路。利用大模型的生成能力,可以快速生成大量的訓練數(shù)據(jù),經(jīng)過簡單的人工審核之后,就可以加入到深度學習模型訓練中,快速擴展模型的訓練數(shù)據(jù)量,從而不斷提高機器人的匹配率,快速提高機器人解決問題的能力。
AI大模型,我們在路上
沃豐科技GaussMind作為智能客服領(lǐng)域的先鋒官,本著以客戶為中心的原則,時刻關(guān)注行業(yè)內(nèi)前沿技術(shù),努力探索大模型技術(shù)發(fā)展方向,算法團隊不斷優(yōu)化大模型依賴的底層技術(shù),積累了大量的技術(shù)經(jīng)驗和知識資源。
依靠核心產(chǎn)研團隊,沃豐科技GaussMind不斷打磨適合企業(yè)服務(wù)場景的AI產(chǎn)品。始終按照既追求大模型的能力,又在保證精度要求的前提下,抓住響應(yīng)時長的底線。讓智能客服領(lǐng)域體驗到了大模型帶來的技術(shù)成果,為企業(yè)打造了更佳的客戶體驗,更好地賦能業(yè)務(wù)進行數(shù)字化轉(zhuǎn)型。
AI大模型的到來及應(yīng)用示范,讓人們看到了人工智能前沿技術(shù)走向通用的希望。沃豐科技GaussMind也將乘上大模型這股浪潮,實現(xiàn)NLP、ASR等深度學習技術(shù)的突破,向著“未來客服互動由AI主導”的愿景不斷前行。
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/update/17173
