文獻(xiàn)文獻(xiàn)文獻(xiàn)文獻(xiàn)文獻(xiàn)新科技科技科技科技知識(shí)產(chǎn)權(quán)
#文章僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng)#
來源:IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)
原標(biāo)題:挑戰(zhàn)日本最強(qiáng)AI翻譯引擎!出版社這次拿出了硬科技
機(jī)器翻譯一直是阻礙專利領(lǐng)域技術(shù)全球跨語言信息化應(yīng)用的一個(gè)核心技術(shù)難題。
而由于近年來人工智能技術(shù)的飛速發(fā)展,機(jī)器翻譯公司如雨后春筍般迅速發(fā)展,國外的Google、微軟已經(jīng)在各領(lǐng)域應(yīng)用機(jī)器翻譯技術(shù)。
筆者了解到,近日,日本一款DeepL在線機(jī)器翻譯軟件,號(hào)稱在實(shí)例評(píng)測(cè)中碾壓了谷歌翻譯,更是引起了機(jī)器翻譯領(lǐng)域的轟動(dòng)!
盡管如此,專利領(lǐng)域的機(jī)器翻譯由于科技詞語的晦澀,同時(shí)要求具有很嚴(yán)謹(jǐn)?shù)姆梢?guī)范性,增加了人工智能技術(shù)在專利機(jī)器翻譯中應(yīng)用的難度。
而隨著技術(shù)的不斷更新迭代,這種情況正在逐步發(fā)生變化!
筆者發(fā)現(xiàn),作為專利翻譯國家隊(duì)的知識(shí)產(chǎn)權(quán)出版社也推出了應(yīng)用于科技與專利文獻(xiàn)翻譯的機(jī)器翻譯引擎——科專笑飛,或許這將極大推進(jìn)機(jī)器翻譯技術(shù)在專利領(lǐng)域的應(yīng)用!
今天NnTech 新科技評(píng)測(cè)團(tuán)隊(duì),將對(duì)最近很火爆的DeepL與科專笑飛做一個(gè)專業(yè)評(píng)測(cè),看看在科技文本機(jī)器翻譯領(lǐng)域,究竟誰能更勝一籌!
一、漢日雙向評(píng)測(cè)
評(píng)測(cè)樣本:
樣本隨機(jī)取自2020年最新的專利申請(qǐng)文獻(xiàn),共計(jì)50句
評(píng)測(cè)時(shí)間:
評(píng)測(cè)時(shí)間為2020年4月2日
評(píng)測(cè)對(duì)象:
評(píng)測(cè)對(duì)象為科專笑飛機(jī)器翻譯系統(tǒng)和DeepL機(jī)器翻譯系統(tǒng)的當(dāng)前最新翻譯結(jié)果結(jié)果取自兩系統(tǒng)官方網(wǎng)站翻譯界面:
科專笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評(píng)測(cè)方式:
評(píng)測(cè)采取人工評(píng)測(cè)的方式
說明:人工評(píng)測(cè),以國家語言文字工作委員會(huì)發(fā)布的機(jī)器翻譯譯文的人工評(píng)測(cè)標(biāo)準(zhǔn)為標(biāo)準(zhǔn),若干名評(píng)測(cè)人員按照標(biāo)準(zhǔn)分別為兩種翻譯結(jié)果進(jìn)行打分,分制為100分制。人工評(píng)測(cè)采用隨機(jī)評(píng)測(cè),事先未告知評(píng)測(cè)人員所評(píng)系統(tǒng)相關(guān)具體細(xì)節(jié)及所閱讀的譯文是哪個(gè)系統(tǒng)的譯文,打分過程中評(píng)測(cè)人員無溝通,以此來盡可能地避免人工評(píng)測(cè)的主觀性。
漢-日方向評(píng)測(cè)結(jié)果:
漢-日方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
日-漢方向評(píng)測(cè)結(jié)果:
日-漢方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
評(píng)測(cè)結(jié)論:
從得分上來看,科專笑飛機(jī)器翻譯系統(tǒng)漢-日、日-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-日方向,科專笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了13.5分;日-漢方向,科專笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了9.5分;從雙向來說,兩者分差都比較大,這證明了科專笑飛機(jī)器翻譯系統(tǒng)漢-日、日-漢雙向翻譯要明顯優(yōu)于DeepL機(jī)器翻譯系統(tǒng)。
二、漢英雙向評(píng)測(cè)
評(píng)測(cè)樣本:
樣本隨機(jī)取自2020年最新的專利申請(qǐng)文獻(xiàn),共計(jì)40段(約120句)
評(píng)測(cè)時(shí)間:
評(píng)測(cè)時(shí)間為2020年4月2日
評(píng)測(cè)對(duì)象:
評(píng)測(cè)對(duì)象為科專笑飛機(jī)器翻譯系統(tǒng)和DeepL機(jī)器翻譯系統(tǒng)的當(dāng)前最新翻譯結(jié)果。結(jié)果取自兩系統(tǒng)官方網(wǎng)站翻譯界面:
科專笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評(píng)測(cè)方式:
評(píng)測(cè)采取人工評(píng)測(cè)的方式
漢-英方向評(píng)測(cè)結(jié)果:
漢-英方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
英-漢方向評(píng)測(cè)結(jié)果:
英-漢方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
評(píng)測(cè)結(jié)論:
科專笑飛機(jī)器翻譯系統(tǒng)漢-英、英-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-英方向,科專笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了9.115分;英-漢方向,科專笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了5.34分;從雙向來說,兩者分差都比較大,這證明了科專笑飛機(jī)器翻譯系統(tǒng)漢-英、英-漢雙向翻譯要明顯優(yōu)于DeepL機(jī)器翻譯系統(tǒng)。
三、評(píng)測(cè)實(shí)例
評(píng)測(cè)團(tuán)隊(duì)隨機(jī)抽取了評(píng)測(cè)實(shí)例,示例如下:
實(shí)例一:
結(jié)論:
科專笑飛的譯文在專利術(shù)語的選擇上更加地道,DEEPL的譯文在選詞翻譯方面按照原文進(jìn)行直譯,雖然翻譯正確,但相對(duì)來說,表達(dá)不夠?qū)I(yè)地道。
實(shí)例二:
結(jié)論:
科專笑飛引擎對(duì)長句、長段落進(jìn)行了綜合性的學(xué)習(xí)和處理,能夠保證整體的結(jié)構(gòu)完整。而DeepL的引擎在長段落整體翻譯時(shí),會(huì)出現(xiàn)漏譯、句子信息缺失、翻譯不完整的情況。比如此例中,該引擎并沒有將句子完全翻譯完,丟失了句子后半部分的信息。
四、評(píng)測(cè)總結(jié)
從測(cè)試結(jié)果可以看出來,對(duì)于專利翻譯或科技文獻(xiàn)的翻譯,科專笑飛已經(jīng)做了專門的訓(xùn)練。以此同時(shí)對(duì)專利文本翻譯中的一些表達(dá)方式及格式處理也進(jìn)行了優(yōu)化處理,更適合科技領(lǐng)域的文本翻譯。
知識(shí)產(chǎn)權(quán)出版社“秘密”進(jìn)行的機(jī)器翻譯引擎研制項(xiàng)目究竟是什么來頭?
測(cè)試團(tuán)隊(duì)從科專笑飛的官網(wǎng)了解到:
科專笑飛是由知識(shí)產(chǎn)權(quán)出版社自主研發(fā)的新一代人工智能多語種專利文獻(xiàn)機(jī)器翻譯系統(tǒng),實(shí)現(xiàn)了英、日、德等多語種與中文之間雙向的全自動(dòng)機(jī)器翻譯和人機(jī)交互計(jì)算機(jī)輔助翻譯。
系統(tǒng)基于全球多語種專利文獻(xiàn)數(shù)據(jù),采用國際前沿的多策略神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯核心技術(shù),融合模板、統(tǒng)計(jì)、規(guī)則、實(shí)例等多種機(jī)器翻譯方法,針對(duì)專利文獻(xiàn)特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語義選擇等特點(diǎn),對(duì)翻譯知識(shí)庫進(jìn)行優(yōu)化配置和構(gòu)建,使譯文達(dá)到了90%的準(zhǔn)確率和商用推廣性,是幫助用戶實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)領(lǐng)域多語言信息獲取和翻譯的有力工具。
其技術(shù)優(yōu)勢(shì)在于:
采用國際前沿的多策略神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯核心技術(shù),融合模板、統(tǒng)計(jì)、規(guī)則、實(shí)例等多種機(jī)器翻譯方法,針對(duì)專利文獻(xiàn)特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語義選擇等特點(diǎn),對(duì)翻譯知識(shí)庫進(jìn)行優(yōu)化配置和構(gòu)建,使專利譯文達(dá)到了90%以上的準(zhǔn)確率。
科技創(chuàng)新目前已經(jīng)成為全球未來競(jìng)爭的核心,而科技文獻(xiàn)利用將成為未來科技創(chuàng)新技術(shù)情報(bào)的重要信息途徑,而機(jī)器翻譯正是解決全球跨語言技術(shù)應(yīng)用的加速器。
評(píng)測(cè)團(tuán)隊(duì)驚嘆國內(nèi)AI技術(shù)在專利領(lǐng)域落地技術(shù)研發(fā)實(shí)力和技術(shù)先進(jìn)性,類似科專笑飛這樣的最新產(chǎn)品也代表了目前全球技術(shù)機(jī)器翻譯引擎的最高水準(zhǔn)。
相信未來,科專笑飛會(huì)給我們帶來更多的改變與驚喜!
來源:IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
點(diǎn)擊圖片,查看專題詳情!
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來源IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://jupyterflow.com/
文章不錯(cuò),犒勞下辛苦的作者吧