首頁 新聞 > 研究 > 正文

5G新通話不簡單:不僅聽見,還能看懂

4月12日,中國移動在首鋼園國家冬季訓練中心速滑館舉辦“5G新通話,預(yù)見新未來”產(chǎn)品發(fā)布會,正式發(fā)布5G新通話產(chǎn)品,并宣布部分終端已在全國支持5G VoNR超清通話業(yè)務(wù),打造可視化、多媒體、高感知、全交互的全新媒體。

將覆蓋所有新上機型

在發(fā)布會上,中國移動市場經(jīng)營部總經(jīng)理首建國介紹,與互聯(lián)網(wǎng)的語音視頻通話相比,5G新通話能夠基于中國移動5G網(wǎng)絡(luò),實現(xiàn)高清視頻通話,通話質(zhì)量穩(wěn)定,幾乎沒有時延,且電話呼入不中斷。同時,結(jié)合AI技術(shù),5G新通話可以在通話過程中實現(xiàn)中英文實時翻譯、語音轉(zhuǎn)文字等功能,此外還提供了屏幕共享、遠程協(xié)作等特色功能。首建國還介紹說,目前5G新通話功能正陸續(xù)在各大手機終端進行適配,到今年7月,所有終端新推出的機型都將支持5G新通話。

從5G新通話所展示的功能來看,有望成為一款“5G殺手級應(yīng)用”。在這一被業(yè)界普遍看好的業(yè)務(wù)背后,5G網(wǎng)絡(luò)是核心基礎(chǔ),媒體互動是重要功能擴展,終端支持是保障,其中還有一個關(guān)鍵,就是AI智能語音技術(shù)。

不僅聽見,還能看懂

5G新通話可以讓通話雙方實現(xiàn)語音轉(zhuǎn)文字,同時還可以在屏幕上實時翻譯,讓通話人在聽見的同時,“看懂”通話的內(nèi)容??此坪美斫獾募夹g(shù),背后蘊藏著大量黑科技,例如語音識別、口語理解、語音同傳等等,非深厚的AI語音技術(shù)積累不可為。

這些背后的黑科技,主要來自智能語音和人工智能的頭部企業(yè)科大訊飛,因此,科大訊飛也成為中國移動5G新通話的官方合作伙伴。

據(jù)悉,科大訊飛是北京2022年冬奧會和冬殘奧會官方自動語音轉(zhuǎn)換與翻譯獨家供應(yīng)商。資料顯示,面向冬奧會場景的多語種語音及語言服務(wù)平臺,采用了科大訊飛的“自動語音轉(zhuǎn)換與翻譯”技術(shù),支持60個語種語音合成、69個語種語音識別、168個語種機器翻譯和6個語種交互理解,其中重點語種翻譯準確率達到了95%,平均每句翻譯響應(yīng)時間不超過0.5秒。

口語化體驗更流暢

通話場景下有大量的口語化表達,口語化表達不同于規(guī)范的書面文本,一般表現(xiàn)為內(nèi)容表述不符合語法規(guī)范、語氣詞過重、重復冗余等,這使得直譯時出現(xiàn)明顯的“機翻”痕跡,給機器翻譯在通話場景中的應(yīng)用提出了更高的要求。

科大訊飛的技術(shù)負責人介紹,針對5G新通話口語化場景優(yōu)化,采取了三大措施:一是人機協(xié)同標注常用口語數(shù)據(jù),并補充口語雙語訓練;二是系統(tǒng)性運用了無監(jiān)督/弱監(jiān)督訓練方法,基于大量口語化表達的源、目標語言單語數(shù)據(jù),采用自訓練、回譯算法等強化翻譯模型和語言模型,對口語化表達特性實現(xiàn)增強訓練;三是針對語音識別后處理階段,設(shè)計語氣詞順滑、規(guī)整等模塊,將口語化表達盡可能書面化,從而減少機翻“痕跡”,幫助用戶更好地理解。

中國移動5G新通話背后的人工智能技術(shù),來源于科大訊飛23年來堅持源頭技術(shù)自主創(chuàng)新的深厚積累。科大訊飛在人工智能語音識別、機器翻譯、語義理解等技術(shù)領(lǐng)域處于國際領(lǐng)先地位,曾在諸多國際技術(shù)賽事中獲得冠軍。

(科大訊飛供圖)

關(guān)鍵詞: 科大訊飛 語音識別 中國移動 機器翻譯 人工智能

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號-12