首頁(yè) 資訊 > 創(chuàng)新 > 正文

國(guó)際最新研發(fā)一種人工智能模型 能即時(shí)翻譯101種語(yǔ)言

國(guó)際知名學(xué)術(shù)期刊《自然》最新發(fā)表一篇人工智能研究論文稱,研究人員研發(fā)出一個(gè)人工智能(AI)模型,能即時(shí)翻譯多達(dá)101種語(yǔ)言的語(yǔ)音和文本,包括直接語(yǔ)音到語(yǔ)音翻譯。

這款名為SEAMLESSM4T的人工智能模型,填補(bǔ)了語(yǔ)言覆蓋方面的空白,并且性能優(yōu)于現(xiàn)有的系統(tǒng)。研究團(tuán)隊(duì)說(shuō),本項(xiàng)研究工作或可為快速通用翻譯鋪平道路,其資源公開(kāi)可用(用于非商業(yè)用途),以協(xié)助進(jìn)一步研究包容性語(yǔ)音翻譯技術(shù)。

該論文介紹,科幻小說(shuō)的讀者可能很熟悉《銀河系漫游指南》里的“巴別魚”,這種小魚能侵入耳朵,即時(shí)將一種口語(yǔ)翻譯成另一種口語(yǔ)。類似“巴別魚”的這種工具對(duì)于促成全球互聯(lián)環(huán)境下的交流非常有用,但大多數(shù)現(xiàn)有的機(jī)器學(xué)習(xí)翻譯系統(tǒng)都是文本導(dǎo)向,或者需要語(yǔ)音識(shí)別、翻譯成文本、再將文本轉(zhuǎn)換成語(yǔ)音好幾步。此外,現(xiàn)有語(yǔ)音到語(yǔ)音模型的語(yǔ)言覆蓋范圍也遠(yuǎn)低于文本到文本的模型,并且傾向于從源語(yǔ)言翻譯成英語(yǔ),而非從英語(yǔ)到另一種語(yǔ)言。

為了解決這些限制,在本項(xiàng)研究中,美國(guó)Meta基礎(chǔ)人工智能研究的“無(wú)縫交流團(tuán)隊(duì)”開(kāi)發(fā)出一個(gè)單一模型SEAMLESSM4T,其支持多達(dá)101種語(yǔ)言之間的多種翻譯模式,可以支持語(yǔ)音到語(yǔ)音(識(shí)別101種語(yǔ)言并翻譯為36種語(yǔ)言)、語(yǔ)音到文本(101種語(yǔ)言譯為96種)、文本到語(yǔ)音(96種語(yǔ)言譯為36種)、文本到文本(96種語(yǔ)言)的翻譯,以及自動(dòng)語(yǔ)音識(shí)別(96種語(yǔ)言)。

 

研究團(tuán)隊(duì)表示,在語(yǔ)音到語(yǔ)音的翻譯中,SEAMLESSM4T的文本翻譯比現(xiàn)有系統(tǒng)準(zhǔn)確率提升23%。同時(shí),該人工智能模型可過(guò)濾背景噪音并適應(yīng)說(shuō)話者的差異。

《自然》同期發(fā)表同行專家的“新聞與觀點(diǎn)”文章指出,雖然后續(xù)還需要進(jìn)一步優(yōu)化,但人工智能模型SEAMLESSM4T可能代表著向跨越語(yǔ)言障礙促進(jìn)交流的進(jìn)步。(完)

關(guān)鍵詞: 思念是一種病吉他譜 我的長(zhǎng)生果課文筆記 稱骨法幾斤幾兩對(duì)照?qǐng)D

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3