#本文僅代表作者觀點,不代表IPRdaily立場,未經(jīng)作者許可,禁止轉(zhuǎn)載#
“在知識產(chǎn)權(quán)領(lǐng)域來說,甚至有人開始嘗試讓ChatGPT撰寫專利文件。那么,ChatGPT是否能應(yīng)用于專利檢索?ChatGPT的檢索能力如何?”
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:梁嘉琦 嘉權(quán)專利商標事務(wù)所軟件通訊與電學總監(jiān)
近日,人工智能技術(shù)ChatGPT成為了熱門話題,受到了廣泛的關(guān)注和討論。其在自然語言處理和文本分析等領(lǐng)域的應(yīng)用效果備受好評,引起了人們的極大興趣。ChatGPT(Generative Pre-trained Transformer)是備受矚目的一項技術(shù)。它基于深度學習和自然語言處理技術(shù),可以用來生成自然語言文本、對話、問答等各種語言模型,是目前在語言領(lǐng)域中最先進和高效的技術(shù)之一。
ChatGPT的應(yīng)用范圍非常廣泛。例如,它可以用于智能客服、虛擬助手、智能問答、機器翻譯、摘要生成等多個領(lǐng)域。在醫(yī)療、金融、法律、媒體等領(lǐng)域,也可以應(yīng)用ChatGPT來生成和分析文本數(shù)據(jù),從而提高工作效率和準確度。
隨著ChatGPT的熱潮,人們不斷開發(fā)對ChatGPT的應(yīng)用,使ChatGPT被應(yīng)用在不同的領(lǐng)域。例如,它可以用于智能客服、虛擬助手、智能問答、機器翻譯、摘要生成等多個領(lǐng)域。在醫(yī)療、金融、法律、媒體等領(lǐng)域,也可以應(yīng)用ChatGPT來生成和分析文本數(shù)據(jù),從而提高工作效率和準確度。在知識產(chǎn)權(quán)領(lǐng)域來說,甚至有人開始嘗試讓ChatGPT撰寫專利文件。
另一方面,ChatGPT是否能應(yīng)用于檢索專利文獻,我們不禁對此展開思考。傳統(tǒng)的專利檢索工作需要專利代理師進行人工檢索和篩選,而ChatGPT作為一種具有高度自動化的技術(shù),可以自動處理文本數(shù)據(jù)、提取和分析信息。
我們想象一個場景,如果用戶只需要將技術(shù)內(nèi)容或者專利公開號輸入到ChatGPT中就能夠自動完成專利文獻的檢索,就不用專門委托專利代理師檢索了,這也讓一些專利檢索從業(yè)人員開始感到擔憂,他們的工作可能會被ChatGPT取代。
究竟ChatGPT是否能應(yīng)用于專利檢索,以及ChatGPT的檢索能力如何。我們對此直接進行了相關(guān)的測試。
這是我們準備的檢索對象:
圖1
如上述圖1所示,公開了一種杯子,包括杯體、杯蓋和螺旋式吸管,吸管頂端作為吸水口,吸管最下端為進水口,其特征在于,該螺旋式吸管纏繞杯子外壁設(shè)置。由于吸管纏繞在杯體的外壁,因此能夠起到抗震保護杯體的效果。
針對上述內(nèi)容,我們直接使用ChatGPT進行檢索,看看檢索效果如何?在ChatGPT對話框中,我們輸入如下語句,并得到ChatGPT的回答。
圖2
可以看到,ChatGPT幾乎立即就完成了檢索,給出了公開號、專利名稱和近似的理由,根據(jù)ChatGPT輸出的內(nèi)容,好像都找到了與本申請十分接近的專利文獻,這是不是證明ChatGPT的確能不費吹灰之力完成專利檢索呢?我們對ChatGPT的檢索結(jié)果進行驗證:
圖3
通過對ChatGPT給出的結(jié)果進行檢索,發(fā)現(xiàn)和我們要檢索的內(nèi)容毫不相關(guān),那么,為什么ChatGPT會給出這樣不靠譜的答案呢?
我們通過了解知道,ChatGPT實質(zhì)是一個語義應(yīng)答模型,是不具備實時檢索專利數(shù)據(jù)庫功能的,因此其給出的答案可能毫無真實性可言。
這說明ChatGPT的專利檢索能力失敗呢?我們換一個思路,直接檢索不行,用來構(gòu)建檢索式行不行呢?理論上,ChatGPT擅長的是語義識別提取,那么提取文本中的關(guān)鍵信息并自動構(gòu)建檢索式,用戶就可以直接在數(shù)據(jù)庫中進行檢索,這樣也可以取代專利檢索從業(yè)人員的工作,就這個思路,我們進一步進行操作,讓ChatGPT提取技術(shù)文本中的特征并自動構(gòu)建檢索式:
圖4
可以看出,ChatGPT根據(jù)技術(shù)效果從技術(shù)文本中提取了杯子,螺旋吸管,纏繞以及抗震這些特征構(gòu)建檢索式,看上去還是比較準確,不過這是在有益效果說的比較清楚的情況下,我們輸入的技術(shù)效果是根據(jù)特征推理出來的,也就是說我對技術(shù)效果做了一定的加工,在大多數(shù)情況下,復制的技術(shù)效果都比較籠統(tǒng),這樣ChatGPT的識別就會出現(xiàn)問題,例如:
圖5
當技術(shù)效果不結(jié)合特征進行描述時,ChatGPT是無法準確提取檢索要素的。那么,如果連有益效果也不給出,ChatGPT能提取出準確的檢索要素嗎?
圖6
可以看出,如果不限定檢索式,則會將技術(shù)文本中的所有關(guān)鍵詞進行檢索式的構(gòu)建,檢索范圍太小,導致檢索不出專利。對比圖4至圖6ChatGPT給出的檢索式,認為圖4的檢索式比較符合要求,我們采用字段“標題+摘要+權(quán)利要求”驗證圖4給出的檢索式,得到如下結(jié)果:
圖7
從圖7中可以看出,只有9篇檢索結(jié)果,而且大多是不相關(guān)的內(nèi)容。從上面可以看出,在完成關(guān)鍵詞的提取及檢索式構(gòu)建上,目前ChatGPT還不太勝任。也就是說,用戶如果不懂檢索的原理,不分析技術(shù)內(nèi)容,只是簡單把技術(shù)文本交給ChatGPT進行檢索式的構(gòu)建,檢索結(jié)果是有問題的,這樣會導致用戶認為技術(shù)文本是具備創(chuàng)造性的錯誤結(jié)論。
那么,ChatGPT是否能夠在專利代理師的配合下很好地完成檢索工作呢?我們進一步進行測試,這次,根據(jù)ChatGPT的強項,我們先讓ChatGPT對技術(shù)文本進行關(guān)鍵詞的提取:
圖8
可見,ChatGPT對技術(shù)文本的關(guān)鍵詞提取還是十分準確的,分詞也是較為合理。這樣,專利代理師就可以直接在關(guān)鍵詞結(jié)果中選擇所需要檢索的檢索要素并讓chatgpt構(gòu)建檢索式(即專利代理師參與了基本檢索要素的選擇),例如:
圖9
從結(jié)果可以看出,ChatGPT對于關(guān)鍵詞的擴展能力是比較優(yōu)秀的,而且生成的檢索式能夠直接復制到檢索數(shù)據(jù)庫中進行檢索,不用再手動輸入括號以及邏輯運算符了。我們再對檢索式進行驗證,得到如下結(jié)果。
圖10
十分驚喜的是,這次的檢索結(jié)果比較理想,檢索結(jié)果都是目標專利。也就是說,專利代理師通過分析技術(shù)方案,確定準確的檢索要素,再由chatgpt進行關(guān)鍵詞擴展和檢索式構(gòu)建,能夠在一定程度上提高專利代理師的檢索效率,特別是在初檢的時候,專利代理師在閱讀完技術(shù)方案后,在chatgpt的輔助下能較快地得到專利的初檢結(jié)果,并且能夠方便地進一步對檢索式進行調(diào)整(例如增減關(guān)鍵詞、用分類號代替某個檢索要素、調(diào)整檢索字段等等)。
另外,是否能夠讓ChatGPT自動找分類號呢?我們也進行了測試:
圖11
可見,ChatGPT也能夠很快地給出分類號,但需要警惕的是,每當ChatGPT輸出數(shù)字或者號碼答案時,一定要對其進行驗證,果不其然,分類號都是不準確的。
圖12
從圖12可知,ChatGPT給出的分類號只是餐桌上的飲水器皿,并非傳統(tǒng)意義上的水杯。因此,用ChatGPT進行分類號的提取準確性較低,還不如對圖10中的檢索結(jié)果進行分類號的統(tǒng)計,這樣還能更快獲得水杯的分類號。
綜上所述,ChatGPT并不能自動完成專利檢索任務(wù),雖然ChatGPT能夠較好地完成關(guān)鍵詞的提取,但是ChatGPT不能判斷哪些關(guān)鍵詞為基本檢索要素,而對基本檢索要素的把握是專利代理師能夠較好完成檢索任務(wù)的關(guān)鍵,也是專利代理師的核心價值所在,這部分是目前ChatGPT所不能取代的。因此目前的ChatGPT并不會導致專利檢索從業(yè)人員的失業(yè)。
那么是否讓ChatGPT成為專利代理師的檢索工具,提高檢索效率嗎?我認為是有限的,一方面,專利代理師的檢索戰(zhàn)場是在專利數(shù)據(jù)庫中,檢索所花費的大部分時間精力在于檢索式的調(diào)整和文獻的瀏覽,而ChatGPT僅僅提供了一種快速進入“戰(zhàn)場”的方法。雖然ChatGPT的關(guān)鍵詞擴展能力較優(yōu),但是一般的專利數(shù)據(jù)庫中都自帶了關(guān)鍵詞擴展工具,也能很好地完成關(guān)鍵詞擴展的操作,使用ChatGPT進行關(guān)鍵詞擴展是只應(yīng)用上更加方便,并不會為檢索質(zhì)量和效率帶來實質(zhì)性的飛躍。
由于ChatGPT的帳號注冊以及運行環(huán)境均具有不小的門檻,因此我認為沒有必要為了輔助檢索而特意使用ChatGPT。如果想嘗鮮使用ChatGPT進行檢索的朋友,也可以參考上文中我和ChatGPT之間的對話。
當然,隨著ChatGPT的迭代更新,未來可能會實現(xiàn)基本檢索要素的準確識別,或者在專利文獻近似度判斷方面能有更好的表現(xiàn)。我們也會密切關(guān)注技術(shù)進展,并為大家更新相關(guān)的資訊以及使用技巧。
(原標題:探索ChatGPT在專利檢索中的應(yīng)用)
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:梁嘉琦 廣州嘉權(quán)專利商標事務(wù)所有限公司
編輯:IPRdaily趙甄 校對:IPRdaily縱橫君
注:原文鏈接:探索ChatGPT在專利檢索中的應(yīng)用(點擊標題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負責人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://jupyterflow.com”
文章不錯,犒勞下辛苦的作者吧