來源:IPRdaily中文網(IPRdaily.cn)
原標題:專利機器翻譯,到AIpatent這樣,如何?
近日,南京深思得信息科技有限責任公司聯合上海語智信息科技有限責任公司發(fā)布了專利跨語言綜合服務平臺“AIpatent”,并先期發(fā)布了專利專用機器翻譯服務(t.aipatent.com)和專利詞典服務(d.aipatent.com)兩個線上服務板塊。據悉,AIpatent通過在線機器翻譯、離線專利專用機器翻譯引擎定制、專利專用詞典、專業(yè)專利人工翻譯等解決方案,消除專利從業(yè)人員在調查、檢索、翻譯國外專利時經常遇到的語言障礙。
t.aipatent.com 專利專用機器翻譯界面
d.aipatent.com 專利專用檢索詞典界面
據了解,AIpatent上述兩項服務的研發(fā)人員中的張方元,他曾于2007年至2012年就職于永新事務所的日本部,在涉外專利方面,有很多的經歷和經驗。據他介紹,在涉外專利方面,行業(yè)人員經常會遇到3個問題:
1、雖然涉外所的翻譯業(yè)務收入所占比重能占到4成甚至更多,但是翻譯人員大部分時間浪費在打字的重復性、低水平的勞作上。
近幾年,有的涉外所引入了trados輔助翻譯系統,提升了重復內容的應對效率,但是機器翻譯這個終極解決方案卻始終未能實現突破,市面上做引擎的有很多家,現在NMT算法公開,好像有了語料都能做引擎,但是大部分還是沒有到能讓翻譯人從翻譯的角色轉變到思考(審校)的角色上來,大部分用戶的感覺是:專利機器翻譯,離實用化還差的遠。
2、代理人遇到不會的語種的對比文件而不得不求助其他部門的語言人員或是代理人。
這樣給雙方工作都帶來困擾,別人來問了,你不能不幫,因為將來你也會遇到語言問題要去請教對方;
3、審查員有時候引用對比文件,因為語言不通僅僅靠附圖相似就給出不完全正確的審查意見。
據張方元介紹,為了將涉外專利工作人員,從語言的難題上解放出來,AIpatent團隊,經過數年研究,推出兩款專利常用工具,其分別為專利專用機器翻譯服務:t.aipatent.com和專利專用檢索詞典:d.aipatent.com。
專利專用機器翻譯服務 t.aipatent.com
專利的機器翻譯進入到神經網絡時代以來,其可讀性大大提高,但是在細節(jié)方面仍然需要不斷地打磨。在專利領域,最近幾年無論是WIPO還是歐專局,或是Google都推出了適用于專利的機器翻譯服務,其中尤以Google的影響力最大,Google的機器翻譯有時候異常精準,有時候斷句又讓人感到無厘頭。算法沒有太大差別的情況下,誰家打磨的更細,就意味著誰家會脫穎而出,從點滴細節(jié)做起,滿足廣大涉外所的語言需求,是AIpatent的使命。而在隱私性方面,有的事務所全體電腦斷網,只為保證數據不泄露,定制引擎的服務需求也愈發(fā)旺盛。
張方元舉了下面幾個例子,說明具體產品的效果:圖1至圖6分別是日中、日英、英中、英日、中日、中英六個方向的權利要求的譯文。
圈內人都知道權利要求的翻譯是翻譯時候最難的部分,那么AIpatent的機器翻譯處理的如何?
圖1 日中機器翻譯結果
圖2 日英機器翻譯結果
圖3 英中機器翻譯結果
圖4 英日機器翻譯結果
圖5 中日機器翻譯結果
圖6 中英機器翻譯結果
此外,為了方便廣大用戶方便的修改譯文以及下載譯文,AIpatent創(chuàng)新性的在右側增加了編輯框和下載按鈕,如下圖7、8所示。
圖7 批量替換編輯框=可進行替換回退等操作
圖8 至頁面頂部、下載為tmx、excel、txt,copy、修改等快捷鍵一應俱全
專利專用檢索詞典d.aipatent.com
在提到專利術語的痛點,張方元這樣介紹,在涉外業(yè)務中,很多同行們會感同身受,有時候公司有了新客戶,但需要抓緊時間確認這個客戶的用詞特點。有的事務所的做法是專門派人整理這個客戶之前的同族,然后一篇篇去閱讀,提煉出客戶專屬詞典。有時候遇到新案件,碰到新詞,首先要看別家是怎么確詞的。一樣要去翻別家的同族,查找相關的術語,費時費力?,F在有了AIpatent的專利詞典,人工做詞典的事情,再也不需要了。
具體情況看下例子。
詞典分為常規(guī)檢索和高級檢索,常規(guī)檢索默認完全匹配模式,高級檢索可以使用""+-等一般檢索引擎的高級檢索方式進行檢索,比如可以同時限定公司名,IPC分類號等。
在常規(guī)檢索中,如果用戶檢索詞命中了專利詞庫,AIpatent詞典會給出參考譯詞,并將其在專利句對庫中的翻譯數量按從多到少排列,給用戶最直觀的提示。譬如用戶檢索“雷達”這個詞,AIpatent中英詞典和中日詞典會有如下呈現,當然,這里的譯詞和傳統詞典有些不同,是在幾千萬句對庫中進行分析和計算的,可以看到它在句對庫中最常用的翻譯。
圖9
圖10
而在高級檢索中,用戶可以設定一些條件進行檢索,比如檢索谷歌公司的關于“向量”的翻譯,則可以如圖11所示輸入相關關鍵詞,即可得到圖12的結果,此外,點擊公開號則可以直接鏈接到歐專局查看公開文檔。
圖11
圖12
如果想查看其它公司的關于“向量”的翻譯時,則得到如圖13的結果。
再看下左側公司名的排序,以及可以點擊對應句對下方的公司名進行深入確認等。
圖13
張方元還提到,AIpatent的機器翻譯經過語智公司以及南京深思得研發(fā)團隊近80人的全職團隊,歷經2年精細打磨。雖然現在已經迭代到V4.1,但仍然有不少補足,還在不斷優(yōu)化中。歡迎大家多多試用,多提反饋意見。具體試用網站為專利專用機器翻譯服務(t.aipatent.com)和專利專用檢索詞典(d.aipatent.com)。
最后,IPRdaily記者就“AIpatent”系統的開發(fā)目標和未來規(guī)劃采訪了張方元,他提到,隨著貿易戰(zhàn)越來越激烈,“真”研發(fā)的重要性愈發(fā)凸顯。古人說,知己知彼百戰(zhàn)不殆,我們現在應該是知己的。AIpatent的理解,所謂知彼,對我們廣大科研人員來說干掉語言壁壘是第一位,干掉復雜的檢索邏輯,實現概念檢索則是第二位。AIpatent是為了實現上述兩個目標而生。計劃三步走:1、提供專利多領域的高水平機器翻譯服務,在此基礎上實現跨語言檢索;2、利用研發(fā)途中積累的大量經驗,活用到相關概念挖掘中,實現概念檢索;3、在1和2的基礎上提供分領域專利數據定制服務,總結歸納國外某些特定領域的研發(fā)數據,提供類調查服務。
IPRdaily作為全球知識產權產業(yè)媒體會一直關注知識產權的最新發(fā)展態(tài)勢,如果您有更新,更具創(chuàng)新的知識產權工具,可以聯系我們。
來源:IPRdaily中文網
編輯:IPRdaily趙珍 校對:IPRdaily縱橫君
推薦閱讀
【2天成為區(qū)塊鏈IP精英】區(qū)塊鏈知識產權精英特訓營來了!
大咖來了!這些重磅嘉賓將要出席2018全球區(qū)塊鏈知識產權峰會
“投稿”請投郵箱“iprdaily@163.com”
「關于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識產權媒體+產業(yè)服務平臺,致力于連接全球知識產權人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務、政府機構、律所、事務所、科研院校等全球近50多萬產業(yè)用戶(國內25萬+海外30萬);同時擁有近百萬條高質量的技術資源+專利資源,通過媒體構建全球知識產權資產信息第一入口。2016年獲啟賦資本領投和天使匯跟投的Pre-A輪融資。
(英文官網:iprdaily.com 中文官網:iprdaily.cn)
本文來自IPRdaily.cn 中文網并經IPRdaily.cn中文網編輯。轉載此文章須經權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉載,請注明出處:“http://jupyterflow.com/”
文章不錯,犒勞下辛苦的作者吧