一知智能算法團隊:去摘遙不可及的星
如果你問一知人最喜歡聽到的話是什么,那一定會是“你們的機器人也太像真人了吧!”。
從一句話通知到平均對話時長超過一分鐘,從“人工智障”到“金牌客服”,底層核心能力逐漸成熟,語音識別準確率穩(wěn)步提升,一點一滴的進步讓人工智能電話通道的有效觸達成為可能。而在對話體驗不斷提升的背后,站著的,是一群敢于摘星的人,他們就是一知智能算法團隊。
這是一個碩博率達到100%的部門,匯集了眾多業(yè)內(nèi)頂尖的技術(shù)人才。其中有AI Lab主任姜興華等屢獲行業(yè)大獎的牛人,有薛弘揚博士等人工智能科學(xué)家,也有畢業(yè)于東京大學(xué)、美國加州大學(xué)洛杉磯分校、南安普頓大學(xué)、瑞典皇家理工學(xué)院、利物浦大學(xué),浙江大學(xué)、中國科學(xué)技術(shù)大學(xué)、西安交通大學(xué)、華中科技大學(xué)等國內(nèi)外頂尖院校的精英。
作為技術(shù)驅(qū)動型公司,一知智能始終保持對技術(shù)先進性的追求。一知智能算法團隊核心成員來自浙江大學(xué)人工智能研究所和國家重點實驗室,擁有強大的高校研發(fā)背景。創(chuàng)始團隊在校期間屢次在國際大賽中獲獎。2016年知識圖譜構(gòu)建競賽(Knowledge Base Population,簡稱 KBP)領(lǐng)先IBM、科大訊飛、CMU等研究機構(gòu)獲實體檢測任務(wù)(Mention Detection)國際綜合排名第一;2017年在機器閱讀理解大賽(Stanford Question Answering Dataset,簡稱SQuAD)中,領(lǐng)先谷歌、微軟、BAT、科大訊飛等名企,榮獲國際單模型組國際排名第二(國內(nèi)第一)、國際多模型組國際排名第三;2017年SNLI機器閱讀理解大賽打敗了斯坦福、MIT、UIUC、清華等國際頂尖知名高校位列國際排名第一。2019年2月,一知智能與浙江大學(xué)聯(lián)合成立了浙大·一知人工智能研究中心。其中,與微軟亞研院聯(lián)合研發(fā)的FastSpeech算法合成速度比谷歌快260倍;SimulSpeech同聲傳譯算法為同等翻譯效果下業(yè)界最快實時性翻譯;FastLR唇語識別算法為目前世界上解碼速度最快的唇語識別系統(tǒng),比第二名caseded算法快10倍。與此同時,算法團隊還擁有十余項自主研發(fā)的人機語音交互國家專利,語音人工智能領(lǐng)域國家專利數(shù)量在業(yè)內(nèi)遙遙領(lǐng)先,在核心算法技術(shù)上自研已達到行業(yè)頂尖和國際前沿水平。
正是這樣一群人聚在一起,解決行業(yè)頂尖的技術(shù)難題,試圖摘取人工智能皇冠上的明珠,再通過技術(shù)落地讓每一次人機交互的體驗變得更好。2022年,一知智能算法團隊實現(xiàn)了意圖識別系統(tǒng)全面升級,在電商、反電詐、游戲等場景下均實現(xiàn)了超過96%的準確率,與此同時,他們還完成了新一代自研ASR系統(tǒng),識別準確率大幅提升,也進一步優(yōu)化了語音人機交互對話體驗。
他們不僅是一知底層技術(shù)的挖掘者,也是站在行業(yè)前沿的“弄潮兒”。自2022年8月以來,為保護消費者隱私,各大電商平臺相繼推出虛擬號功能,將消費者的手機號碼改為虛擬號碼,現(xiàn)有的外呼手段無法觸達品牌相關(guān)用戶群體。而在短短一個月內(nèi),一知智能就實現(xiàn)了基于虛擬號的完整外呼方案,也是當時市場上唯一實現(xiàn)該外呼方式的廠商。一知智能算法團隊研發(fā)的分機號接通時刻判斷算法也獲得了國家發(fā)明專利,分機號輸入判斷模型和接通狀態(tài)判斷模型能夠在毫秒級(20ms)的時間內(nèi)判斷何時輸入分機號以及用戶是否接起通話,準確率高達99%,在提升外呼效率的同時,也能確保運營商側(cè)能夠準確的接收分機號輸入。
另一方面,算法的優(yōu)化也大幅提高了AI訓(xùn)練師的工作效率。目前,公司已研發(fā)意向等級自動判斷算法,平均可節(jié)約訓(xùn)練師配置話術(shù)約20%的時間,并針對行業(yè)首創(chuàng)的生成式話術(shù)自動化算法完成算法驗證,該項技術(shù)為探索需要大批量話術(shù)交付的業(yè)務(wù)場景提供了可能性。
看看一知 Labs 的核心方向還有哪些!
持續(xù)突破底層核心技術(shù)
語音識別系統(tǒng)
一知智能自研ASR系統(tǒng)使用了最新的conformer模型,與之前版本的傳統(tǒng)模型相比,層數(shù)更多,效果更好。模型設(shè)計采用了U2++結(jié)構(gòu),統(tǒng)一了流式和非流式的模式。在業(yè)務(wù)使用中,采用CTC流式解碼,結(jié)合attention和語言模型rescore,能夠?qū)崟r快速獲得識別的中間結(jié)果,并確保最終預(yù)測結(jié)果的準確率。與此同時,算法團隊還根據(jù)具體業(yè)務(wù)場景的實際使用情況,增加了專有名詞糾錯模塊,提高了ASR系統(tǒng)在各個定制領(lǐng)域中的識別準確率。
意圖識別算法
一知智能的意圖識別算法利用蒸餾算法,有效地減少了算法模型參數(shù),在保持模型高識別率的前提下,大幅度提升算法模型的推理性能,有助于支撐一知業(yè)務(wù)量的增長。同時,一知智能算法團隊也長期致力于模型能力的提升,研究并發(fā)表了相關(guān)技術(shù)的發(fā)明專利。與此同時,利用少樣本學(xué)習(xí)技術(shù),用少量的標注數(shù)據(jù),訓(xùn)練出具有相同性能的算法模型,將模型的通用能力和特定行業(yè)下的垂直場景進行高效融合,賦予了多樣場景快速平鋪的能力。
而近期ChatGPT的出現(xiàn)和火熱意味著深度學(xué)習(xí)意圖識別算法能力有了全新突破,除了ChatGPT這類直接面向終端用戶的產(chǎn)品以外,生成式AI還有更為廣闊的技術(shù)應(yīng)用空間。ChatGPT及其相關(guān)的人工智能內(nèi)容生成技術(shù)也與一知智能現(xiàn)有業(yè)務(wù)息息相關(guān)。一知智能的AI外呼產(chǎn)品已廣泛應(yīng)用于電商、政企、出海等各個行業(yè),引入ChatGPT的強大能力,協(xié)助AI訓(xùn)練師的編寫話術(shù)腳本,能夠顯著提升工作效率,與此同時,將ChatGPT納入真實對話體系,提升對話廣度和深度,最大限度減少“答非所問”。AIGC通用模型能力的持續(xù)發(fā)展必將催生一場內(nèi)容生成產(chǎn)業(yè)變革,也期待多模態(tài)人機交互能力能乘著這陣東風上更上一層樓。
快速響應(yīng)客戶需求和痛點
意向等級判斷算法
在AI外呼場景中,當我們的AI機器人結(jié)束與客戶的通話后,了解該客戶的意向等級(意向強烈、意向一般、意向弱等)是AI外呼公司一項不可避免的緊迫任務(wù),企業(yè)客戶對于意向等級判斷的效率和質(zhì)量有著極高的要求。在算法介入之前,AI訓(xùn)練師需要編寫大量的意向規(guī)則以匹配相關(guān)關(guān)鍵詞來判斷意向,該方式非常耗時且準確率也不高。
算法同學(xué)在分析該場景后發(fā)現(xiàn),這一場景其實非常符合決策樹的邏輯,基于這一判斷,我們針對AI機器人話術(shù)和客戶話術(shù)分別訓(xùn)練了分類算法模型,在拿到這些話術(shù)標簽后,依據(jù)話術(shù)標簽的轉(zhuǎn)換邏輯,從上至下遍歷整個話術(shù),最終自動完成話術(shù)意向等級的判斷。這一算法的引入平均可節(jié)約訓(xùn)練師配置話術(shù)約20%的時間,同時也能大幅提升準確率。
話術(shù)自動化系統(tǒng)
一知智能最新研發(fā)的話術(shù)自動化系統(tǒng)能夠根據(jù)用戶輸入的數(shù)據(jù)直接生成準確、通順的話術(shù)草稿。在算法層面,該系統(tǒng)分為兩部分:一是將話術(shù)編輯的專家知識解構(gòu)成本體模型、語義推理規(guī)則體系、語用分類規(guī)則體系三個維度的數(shù)據(jù);二是基于語義角色和語法規(guī)則的文本生成引擎。話術(shù)自動化系統(tǒng)能夠大大減少AI訓(xùn)練師的早期工作量,并使大批量精細化場景的話術(shù)高效交付成為可能。
分機號外呼算法
為了保護個人隱私,天貓、美團等主流電商平臺,不再直接提供客戶的手機號,而是通過虛擬號的方式提供客戶信息。
對于一知智能這類外號平臺來說,最大的困難在于我們無法在客戶拿起電話的那一刻獲得信號信息,這就導(dǎo)致我們的AI機器人不知從何時開始和客戶對話。因此,一知智能算法團隊針對這一問題,自研了一套分機號接通時刻點判斷系統(tǒng),成為業(yè)內(nèi)最早支持此項技術(shù)的外呼廠商之一,同時該項技術(shù)也獲得了國家發(fā)明專利。分機號輸入判斷模型和接通狀態(tài)判斷模型均能在毫秒級(20ms)的時間內(nèi)判斷何時輸入分機號以及用戶是否接起通話,準確率高達99%,在提升外呼效率的同時,還可以確保運營商側(cè)能夠準確接收分機號碼輸入。
向前一步探索第二曲線
數(shù)字人口型合成算法
一知智能自主研發(fā)的數(shù)字人產(chǎn)品采用了一知智能數(shù)字人業(yè)務(wù)研發(fā)團隊最新推出的由文本和語音驅(qū)動的數(shù)字人口型合成算法,并基于自然語言理解、語音識別、意圖識別、語音合成等一知智能底層核心技術(shù)能力,集成于一知大腦“Yi Brain”,可根據(jù)對話情境完成高度擬人化的對話交流,支持直播、人機交互大屏、終端機等多種交互場景。
利用口型合成算法,只需提前拍攝一個幾分鐘的視頻,即可為視頻中的人物生成虛擬形象。此后就可以使用任意文本和語音,驅(qū)動虛擬形象講述新的內(nèi)容。在生成的視頻中,虛擬形象的面部表情和口型會與新的講述內(nèi)容匹配一致,實現(xiàn)實時表情、音唇同步,如同重新拍攝的短視頻一般,具備極高的真實感;同時又省去了重新布置場景、拍攝真人短視頻的復(fù)雜工序和高昂成本。這項技術(shù)可廣泛應(yīng)用于虛擬人短視頻口播、直播等豐富的商業(yè)化落地場景。
一知智能數(shù)字人研發(fā)團隊由多模態(tài)人機交互領(lǐng)域?qū)<已霌P博士擔任負責人,薛弘揚博士在多模態(tài)可視化交互技術(shù)上的研發(fā)背景和應(yīng)用研究經(jīng)驗補上了一知智能全棧人機交互的最后一塊拼圖。數(shù)字人業(yè)務(wù)的開拓能夠補齊一知現(xiàn)有產(chǎn)品在公域獲客、提升品牌用戶心智的需求短板,為企業(yè)提供更多場景、更高水平的解決方案,幫助企業(yè)客戶在全域營銷擁有更多AI數(shù)字生產(chǎn)力。
2023年,一知智能算法團隊將持續(xù)研發(fā)語音、文本、圖像等多模態(tài)內(nèi)容理解和內(nèi)容生成算法,通過AI技術(shù)提升對話體驗,提升外呼機器人的實施效率。在深入研究多模態(tài)人機交互技術(shù)的同時,借助ChatGPT等大模型算法能力,構(gòu)建屬于一知的技術(shù)護城河。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞:
您可能也感興趣:
今日熱點
為您推薦
遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金
近十年財險業(yè)務(wù)快速發(fā)展 財產(chǎn)保險業(yè)風險保障水平不提升
增額終身壽險成銀保市場上的黑馬 中途退??謺p失保費
更多
- 熱點聚焦:TDK再次入選“科睿唯安全球百強創(chuàng)新機構(gòu)”
- 天天熱門:移遠通信推出輕量化5G RedCap模組Rx255C系列,助力...
- 世界滾動:Tech Mahindra推出SANDSTORM,為電信公司和企業(yè)提...
- 世界焦點!2023年世界移動通信大會:德國電信選擇Mavenir作為...
- 環(huán)球消息!2023年世界移動通信大會:Mavenir和高通將推出人工...
- 榮耀Magic5系列MWC首發(fā) 全球化高端戰(zhàn)略迎來新里程碑
- 當前視訊!塔塔通信在Gartner魔力象限中連續(xù)第十年獲評"領(lǐng)導(dǎo)者"
- 【世界報資訊】直擊技嘉MWC展區(qū),新一代高性能服務(wù)器搶攻AI研...
排行
- 一知智能算法團隊:去摘遙不可及的星
- CBE中國美容博覽會開幕在即,諾斯貝爾攜新品彰顯“戰(zhàn)痘”實力
- 教育賽道未來可期,科大訊飛智慧教育助力孩子個性化發(fā)展
- 陸金所會員2.0襲來:多元化升級用戶權(quán)益,為美好生活賦能
- 明星主播唐笑應(yīng)邀參加首屆中國國際消費品博覽會簽約儀式 助...
- 黃河旋風:超硬材料單晶產(chǎn)品支撐行業(yè)下游產(chǎn)業(yè)發(fā)展
- 重塑IP新場景!鄭州絨言絨語走進鄂爾多斯金鼎亨深度探索
- 一家線上美妝店的反向成長之路:話梅的新零售
- 荷蘭佳貝艾特——進口羊奶粉市場的風向標,營養(yǎng)新選擇
- 滴滴出行上市,估值高達千億美金,竟因這個你沒聽過的業(yè)務(wù)!
最近更新
- 一知智能算法團隊:去摘遙不可及的星
- 焦點快播:@全體家長和教育工作者,務(wù)必做好孩子們的反詐教育...
- 熱點聚焦:高新蜀黍送“貨”上門宣講 讓居民把“安全”帶回家
- 轟轟轟!深夜狂野飆車?處罰一個都跑不了
- 全球觀熱點:緊急預(yù)警!云南多人收到這個假“紅頭文件”!
- 發(fā)現(xiàn)“小黃卡” 立即拍照舉報 重慶市公安局推出“斷黃卡”...
- 花唄分期手續(xù)費怎么收?花唄分期手續(xù)費怎么減免?
- 百利好環(huán)球:國際油價年內(nèi)破百?原油市場前景可期
- 借唄逾期可以申請二次分期嗎?網(wǎng)商貸到期可以延期嗎?
- 公積金能貸款到多少歲?公積金貸款只能用兩次嗎?
- 信用貸款利率一般是多少?信用貸款利率是怎么定的?
- 為什么房貸利息比本金還多?房貸是本金和利息一起扣嗎?
- 熱點聚焦:TDK再次入選“科睿唯安全球百強創(chuàng)新機構(gòu)”
- 網(wǎng)貸太多會怎么樣?網(wǎng)貸申請?zhí)鄶?shù)據(jù)花了怎么辦?
- 銀行備用金是貸款嗎?備用金會出現(xiàn)在征信流水里嗎?
- 銀行貨款少放款怎么辦?房貸放款后還看征信嗎?
- 環(huán)球視訊!“狂飆”式減壓法不可取,正確方式是運動
- 當前快看:n95級口罩多久換一次?
- 天天觀熱點:2月謠言榜出爐,擦亮眼睛別輕信
- 免洗消毒液與消毒液有什么不同?
- cussons品牌介紹?
- “陽康”后一直感到疲勞乏力?醫(yī)生教你如何全方位調(diào)理
- 全球快看點丨春季兒童感冒注意這幾點
- 速讀:免洗手啫喱有用嗎?
- 當前簡訊:宏鑫科技:發(fā)現(xiàn)專利數(shù)行業(yè)墊底 客戶或受同一控制未...
- 世界新消息丨免洗洗手液滴到皮衣咋辦?
- 陜西“三維引領(lǐng)”綠色金融支持生態(tài)保護
- 當前播報:我國加速破解罕見病診療和用藥保障之困
- 熱議:美股三大指數(shù)個人收跌 道指2月份累跌超4% 科技股、中...
- 【聚看點】江蘇十項舉措助推經(jīng)濟運行復(fù)蘇
今日要聞
- 一知智能算法團隊:去摘遙不可及的星
- 熱點聚焦:TDK再次入選“科睿唯安全球百強創(chuàng)新機構(gòu)”
- “無聊猿”BAYC:蟾蜍模式1天后關(guān)閉,審核期持續(xù)到3月7日
- 每日簡訊:Cocos-BCX與NodeReal將基于OP Stack共同開發(fā)BNB Chain Rollup Layer 2
- 灰度法律團隊:SEC對比特幣ETF的處理方式“前后矛盾”
- 【環(huán)球時快訊】彭博社:高盛愿意為數(shù)字資產(chǎn)團隊增加員工
- 每日速訊:ZenGo將在A系列延期融資中籌集1000萬美元
- 國美零售:集團截至2月3日尚未償還的逾期貸款總額約68.9億元
- 全球報道:MetaMask Unity SDK已在Unity Asset Store可用
- 每日熱門:Web3基礎(chǔ)設(shè)施公司Portal完成530萬美元融資