首頁(yè) 新聞 > 創(chuàng)新 > 正文

挑戰(zhàn)CET6翻譯考試的機(jī)器翻譯系統(tǒng)

日前,合肥師范學(xué)院舉辦了一場(chǎng)特殊的考試。說它特殊,是因?yàn)?ldquo;考生”只有一個(gè),而且是一套機(jī)器翻譯系統(tǒng)。考題來自三天前剛結(jié)束的大學(xué)英語(yǔ)六級(jí)(CET6)考試,評(píng)分的是兩位具有六級(jí)閱卷經(jīng)驗(yàn)的高校資深專家。“考生”一口氣做了三道翻譯題,每道題滿分15分,它得到13分的均分,每題用時(shí)只有5秒。“這套機(jī)器翻譯系統(tǒng)的表現(xiàn)讓我們驚喜,翻譯得很地道。”對(duì)于成績(jī),專家的鑒定是:優(yōu)秀!

看似普通的系統(tǒng)背后,是機(jī)器翻譯領(lǐng)域近一個(gè)世紀(jì)的技術(shù)積累,也包含著科大訊飛創(chuàng)新實(shí)現(xiàn)的領(lǐng)域翻譯技術(shù)突破以及最新推出的行業(yè)翻譯解決方案。

大學(xué)英語(yǔ)六級(jí)翻譯測(cè)試共有三道考題。按規(guī)定,考生們只需作答一題,時(shí)間是半小時(shí)。

詞匯量是第一需要具備的,目前六級(jí)詞匯量要求達(dá)到6000個(gè),其中不乏生僻詞匯和短語(yǔ);由于漢英間表達(dá)習(xí)慣的不同,邏輯、語(yǔ)序調(diào)整也十分重要。

科大訊飛團(tuán)隊(duì)12月14日就將機(jī)器和系統(tǒng)封存在公證處,“此舉旨在確保在斷網(wǎng)和無(wú)人工干預(yù)的情況下測(cè)評(píng)。”科大訊飛負(fù)責(zé)機(jī)器翻譯的研發(fā)人員說。12月18日,在公證人員的見證下,考官分別打開三道考題,由人工輸入電腦后系統(tǒng)作答,不到5秒便導(dǎo)出了文本。

成績(jī)令人驚喜:每道題取三位評(píng)分專家的平均分,再計(jì)算三道題的平均分,最終機(jī)器翻譯系統(tǒng)拿下13分。參考往年大學(xué)英語(yǔ)六級(jí)翻譯考題的表現(xiàn),可達(dá)到優(yōu)秀六級(jí)考生的水平。

現(xiàn)場(chǎng)兩位評(píng)分專家來自上海交通大學(xué)外語(yǔ)學(xué)院,“這套系統(tǒng)翻譯出來的語(yǔ)言質(zhì)量很高、語(yǔ)法也很地道,表現(xiàn)好過預(yù)期。”她們給出的評(píng)價(jià)稱:機(jī)器翻譯能準(zhǔn)確表達(dá)原文意思、譯文流暢、結(jié)構(gòu)清晰,可以較好地輔助不同語(yǔ)言的信息溝通。

“到目前為止,機(jī)器翻譯到底達(dá)到了什么樣的水平,還沒有人能夠給出明確答案。”科大訊飛負(fù)責(zé)機(jī)器翻譯的研發(fā)人員說。

據(jù)了解,科大訊飛自2012年啟動(dòng)機(jī)器翻譯的研發(fā)工作,目前很多技術(shù)已達(dá)到世界領(lǐng)先水平。2014年,在IWSLT口譯翻譯比賽上就取得了中英互譯的第一名;2015年NIST國(guó)際openMT機(jī)器翻譯比賽,中英人工主觀分獲得冠軍;剛剛過去的2018年IWSLT比賽,在端到端的語(yǔ)音翻譯上再次以顯著優(yōu)勢(shì)取得第一名。

“但機(jī)器翻譯還是很難,主要是其處理的對(duì)象——自然語(yǔ)言存在復(fù)雜性。”研發(fā)人員介紹,自然語(yǔ)言是人類在社會(huì)生活中,通過不斷的重復(fù)性使用而自然進(jìn)化形成的溝通媒介(語(yǔ)言),并且在此過程中缺少規(guī)劃和設(shè)計(jì),使得語(yǔ)言本身就存在諸多不確定性,“同樣一句話,在不同的語(yǔ)境中不同人就有不同的理解”。

機(jī)器翻譯系統(tǒng)何以在大學(xué)英語(yǔ)翻譯權(quán)威評(píng)測(cè)中獲得好成績(jī)?

“一是核心算法,二是大規(guī)模語(yǔ)料庫(kù),三是高性能計(jì)算平臺(tái)。”研究人員介紹,機(jī)器翻譯技術(shù)是利用計(jì)算機(jī)把一種自然語(yǔ)言翻譯成另一種自然語(yǔ)言,從1933年正式被提出開始,目前已發(fā)展有三代技術(shù)、取得了長(zhǎng)足的進(jìn)步。

“最新一代技術(shù)是基于端到端的神經(jīng)機(jī)器翻譯。”神經(jīng)機(jī)器翻譯算法的提出,是當(dāng)前機(jī)器翻譯取得重大突破的關(guān)鍵。但想拿到高分,少不了“獨(dú)門秘籍”。

“六級(jí)翻譯題涉及文化、經(jīng)濟(jì)、歷史、社會(huì)等多領(lǐng)域,還有不少專業(yè)表達(dá)或中國(guó)特色詞匯,在整個(gè)翻譯系統(tǒng)可供訓(xùn)練的語(yǔ)料中是比較匱乏的。”科大訊飛為了破解這一難題,對(duì)神經(jīng)機(jī)器翻譯進(jìn)行若干改進(jìn),其中一項(xiàng)重要改進(jìn)是領(lǐng)域翻譯技術(shù),即在通用翻譯模型之上進(jìn)行了領(lǐng)域定制。

“翻譯中常會(huì)遇到行業(yè)術(shù)語(yǔ),有的機(jī)器可能沒有見過、有的見過卻在不同行業(yè)有不同翻譯方式。”科大訊飛給出的解決方案是:提前將行業(yè)領(lǐng)域的關(guān)鍵詞匯融入翻譯模型,指導(dǎo)機(jī)器在平日訓(xùn)練中自動(dòng)學(xué)習(xí)術(shù)語(yǔ),從而在翻譯過程中產(chǎn)生正確的譯文。

早在2016年,科大訊飛就發(fā)布了訊飛翻譯機(jī)產(chǎn)品,并在業(yè)界第一個(gè)推出了純離線的神經(jīng)網(wǎng)絡(luò)的離線口語(yǔ)翻譯系統(tǒng)。而今,訊飛翻譯機(jī)的用戶遍及全球170個(gè)國(guó)家。

未來,有了最新的翻譯技術(shù),它們會(huì)有什么改變?

在某跨國(guó)醫(yī)療技術(shù)峰會(huì)現(xiàn)場(chǎng),你可以拿出最新升級(jí)的訊飛翻譯機(jī)2.0,和與會(huì)外賓專家暢聊。從“口袋里的翻譯官”升級(jí)為“行業(yè)翻譯官”,這臺(tái)小機(jī)器在通用翻譯模式下新增行業(yè)翻譯模式,正是使用了該技術(shù);除了金融,在醫(yī)療、計(jì)算機(jī)等行業(yè)專業(yè)場(chǎng)景下都可以實(shí)現(xiàn)中文與英文的及時(shí)互譯。

讓人類更便捷的交流、更輕松的工作,機(jī)器翻譯技術(shù)的發(fā)展也正在實(shí)現(xiàn)著用人工智能建設(shè)美好世界的愿景。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號(hào)-12