我國虛擬數(shù)字人領域首個國家標準《信息技術 客服型虛擬數(shù)字人通用技術要求》近日正式發(fā)布。該標準的出臺填補了行業(yè)技術規(guī)范空白,為客服型虛擬數(shù)字人的研發(fā)、生產(chǎn)和應用提供了統(tǒng)一的技術要求和評估標準。
客服型虛擬數(shù)字人是數(shù)字人技術最重要的應用領域之一,現(xiàn)在已經(jīng)廣泛應用在金融、政務、教育等多個行業(yè),目前數(shù)字人技術以不同“客服”身份廣泛應用于各類商業(yè)場景。
該標準構建了全鏈條技術規(guī)范體系,明確了客服型虛擬數(shù)字人系統(tǒng)的參考框架,涵蓋形象生成、視覺交互、語音交互、情感交互、形象驅動和運營維護等模塊。從基礎的形象呈現(xiàn)到復雜的情感反饋,標準對不同類型、不同場景的數(shù)字人都提出了明確要求。

在形象生成方面,標準規(guī)定2D數(shù)字人形象需保證五官細節(jié)完整清晰,3D超寫實數(shù)字人模型面數(shù)不低于20萬,在交互功能上,要求數(shù)字人支持語音、手勢、肢體動作等多模態(tài)交互,同時具備關鍵詞維護、語料更新等運營維護能力,確保服務持續(xù)優(yōu)化。
讓數(shù)字人客服從“能回應”轉向“會共情”
我國虛擬數(shù)字人領域首個國家標準明確了口型驅動準確率、情感交互成功率等一系列核心性能指標。
國家標準明確口型驅動準確率不低于90%,確保數(shù)字人語音與口型精準同步;手勢交互平均成功率不低于90%,肢體動作交互平均成功率不低于90%,讓肢體語言交流更自然。提出情感交互成功率不低于80%的要求,讓數(shù)字人客服從“能回應”轉向“會共情”。

為實現(xiàn)情感交互要求,標準要求數(shù)字人具備表情采集、姿態(tài)識別、語音情感分析等功能,能精準判斷用戶的喜悅、悲傷、焦急等情緒,并通過表情生成、情感語音合成等方式給出適配反饋。同時,語音交互響應時間不超過2秒,語義理解正確率不低于85%,確保服務既“有溫度”又“有效率”。
為行業(yè)創(chuàng)新發(fā)展注入強勁動力
虛擬數(shù)字人領域的首個國家標準也給國內(nèi)的相關企業(yè)產(chǎn)品研發(fā)和優(yōu)化指明了清晰方向,為行業(yè)創(chuàng)新發(fā)展注入強勁動力。
標準適用于現(xiàn)有2D、3D數(shù)字人產(chǎn)品的升級改造,也為人工智能生成內(nèi)容等新技術的融合應用預留了空間。同時,配套的測試方法正在研制中,將為企業(yè)提供統(tǒng)一的測試基準,幫助企業(yè)快速發(fā)現(xiàn)問題、優(yōu)化產(chǎn)品。

標準給出了客服型虛擬數(shù)字人系統(tǒng)的完整參考架構,明確了形象生成、交互功能、驅動方式等核心模塊的技術要求,讓企業(yè)研發(fā)有章可循。在驅動方式上,支持文本、語音、真人動作捕捉、視頻等多種驅動模式,企業(yè)可根據(jù)應用場景靈活選擇。
編輯:高弼浡