#本文僅代表作者觀點,不代表IPRdaily立場,未經作者許可,禁止轉載#
“技術交底書作為發(fā)明人與企業(yè)IPR及專利代理師溝通的橋梁,其質量不僅影響溝通效率,更是撰寫一份優(yōu)質專利申請文件的基礎。那么,如何將一些專業(yè)術語轉化為發(fā)明人能聽懂的語言,教會發(fā)明人寫一份合格的AI技術交底書呢?”
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:陳會紅
人工智能(AI)領域的專利容易存在保護客體的問題,馬上消費金融股份有限公司深耕AI領域多年,申請了近千件相關的專利。通過大量案例的實踐研究,總結出一套企業(yè)IPR與發(fā)明人溝通的方法論,詳細介紹如下:
技術交底書作為發(fā)明人與企業(yè)IPR及專利代理師溝通的橋梁,其質量不僅影響溝通效率,更是撰寫一份優(yōu)質專利申請文件的基礎,直接影響專利申請的授權率,甚至會影響專利的穩(wěn)定性、維權及許可的價值。
AI領域的技術方案通常涉及算法,對于一名AI方向的企業(yè)IPR,你已熟知專利法、及專利審查指南中對涉及“算法特征的專利申請的審查規(guī)定”,了解到只有“權利要求包含技術特征、記載了對要解決的技術問題采用了利用自然規(guī)律的技術手段、并且由此獲得符合自然規(guī)律的技術效果”的專利申請才有可能獲得授權。然而,“技術特征,技術問題、技術手段、技術效果、自然規(guī)律”這些術語,如果直接給到發(fā)明人,估計大部分發(fā)明人都暈菜了。
那么,如何將這些專業(yè)術語轉化為發(fā)明人能聽懂的語言,教會發(fā)明人寫一份合格的AI技術交底書呢?由于目前在中國的相關法規(guī)中,沒有非常明確的關于“技術”、“自然規(guī)律”等概念的定義,需要通過典型審查案例的研究和總結,來給發(fā)明人撰寫技術交底書指明方向。
1.技術領域:技術應用的具體技術領域,建議與技術實際應用的至少一個應用場景結合闡述。若為前瞻性的預研類技術,建議與可能應用到的至少一個應用場景結合闡述。
示例如下:信息檢索和推薦……
2.技術問題:結合上述場景,先闡述現(xiàn)有的算法、模型在實際應用中或預研過程中存在的問題,進而從技術的角度推導出本方案能解決什么問題。
示例如下:將GAN應用于信息檢索,為了解決IGRAN的問題,CFGAN以Vector-Wise Training的方式進行訓練:對于每個用戶,以他的歷史交互序列Vector作為模型輸入。但這一做法的問題在于Vector的粒度過大,僅僅依靠GAN的損失函數(shù)并不足以充分訓練生成器,這樣將會導致GAN不能完全捕獲文本信息,導致訓練GAN的預測能力較低。本方案通過添加G重構后Vector的生成損失(Reconstruction Loss)來輔助訓練……。
3.技術手段:對于上述的問題,闡述具體的解決方案。包括不限于:算法應與具體技術領域(應用場景)緊密結合闡述,緊密結合指的是至少算法的輸入、輸出數(shù)據(jù)應在該具體技術領域中有技術含義。涉及到公式,寫明公式中各參數(shù)的技術含義。若算法的輸入、輸出數(shù)據(jù)是沒有技術含義的數(shù)據(jù),如僅為“樣本”、“訓練數(shù)據(jù)”等,專利代理師在撰寫申請文件時亦無法知曉算法中各數(shù)據(jù)的含義,則專利申請存在較大的駁回風險。
示例如下:(基于篇幅問題,僅示出部分內容以做克服客體問題示例說明,不是發(fā)明的全部內容,亦不涉及創(chuàng)造性問題)
DPGAN的整體架構及流程:如下圖所示,DPGAN模型包含生成模型G和判別模型D兩個部分。其中,G采用DeepFM模型,D采用BPR模型,目的是在歷史數(shù)據(jù)中獲得更多的有效信息,更好的完成商品或者信息的推薦。【tips:與具體應用場景結合】
tips:附圖可以更直觀的幫助理解技術方案
在數(shù)據(jù)方面,使用用戶基本數(shù)據(jù)和對象數(shù)據(jù),用戶基本數(shù)據(jù)包含……等結構化數(shù)據(jù)及隱式信息,對象數(shù)據(jù)包含……等。推薦過程方面,輸入某一用戶數(shù)據(jù)信息,G生成該用戶的偏好序列,即圖中的生成向量;把生成向量和真實向量組成三元組的形式,即
其中,代表用戶u對物品i的喜愛程度。生成模型G得到的用戶偏好序列與真實序列的近似程度,決定著生成模型G性能的優(yōu)劣?!総ips:公式中各參數(shù)有具體的技術含義】
由此可得生成模型G的目標函數(shù)為:
其中,是G的正則化系數(shù),是真實數(shù)據(jù)的序列,是G的生成序列。
判別模型D:
使用BPR作為判別模型,用于區(qū)分真實數(shù)據(jù)和生成數(shù)據(jù)。在BPR算法中,把用戶u對應的物品進行標記,如果用戶u在同時有物品i和j的時候點擊了i,那么就得到了一個三元組
假設
其中,是正則化參數(shù),表示排序序列,表示與j相比用戶更偏愛i,是采樣獲得的數(shù)據(jù)集。
對判別模型D,可表示為:
其中,代表用戶u對物品i的喜愛程度,表示與j相比用戶更偏愛i的概率,和分別是用戶和物品的隱向量,是物品的偏置表示。
由此可得生成模型G的目標函數(shù)為:
其中,是D的正則化系數(shù)。
生成模型G訓練、優(yōu)化:
……
判別模型D訓練、優(yōu)化:
……
4.技術效果:從技術角度推導出的效果,即技術手段和技術效果之間是強關聯(lián)的,需結合技術手段闡述技術效果的產生原因。技術效果若有實驗數(shù)據(jù)證明,效果更直觀,如本方案的模型與現(xiàn)有模型的結果對比數(shù)據(jù)。若效果和技術手段是孤立的,或者僅為數(shù)學意義上、用戶體驗上的效果,則不能被認定為本方案的技術效果。
示例如下:如前所述,GAN網(wǎng)絡具有許多優(yōu)勢,但是,GAN網(wǎng)絡也存在著訓練過程復雜的問題。其一,訓練不穩(wěn)定問題,容易出現(xiàn)震蕩和收斂假象。因為判別模型 D 損失降級會改善生成模型 G 的損失,反之亦然,因此無法根據(jù)損失函數(shù)的值來判斷收斂。其二,模型崩潰問題,GAN的訓練過程可能發(fā)生崩潰問題,生成模型開始退化,總是生成同樣的樣本點,無法繼續(xù)學習。當生成模型崩潰時,判別模型也會對相似的樣本點指向相似的方向,訓練無法繼續(xù)。
本方案使用模型預訓練來優(yōu)化GAN網(wǎng)絡的訓練問題,即分別對生成模型G和判別模型D進行預訓練。生成模型G是在DeepFM算法基礎上完成的,該算法既可以作為特征提取器,也可以獨立使用完成推薦過程,因此可以預訓練生成模型G;判別模型D是在BPR算法基礎上完成的,依據(jù)采樣數(shù)據(jù)對的特點,可采用矩陣分解的方式預訓練判別模型D。當生成模型G和判別模型D處于穩(wěn)定狀態(tài)時,DPGAN模型再依據(jù)對應的優(yōu)化方式不斷迭代持續(xù)優(yōu)化,進一步提升網(wǎng)絡的效果,解決了訓練困難的問題,進一步提升了模型性能。
本方案基于GAN網(wǎng)絡思想的DPGAN網(wǎng)絡架構,DPGAN具備更好的特征抓取能力以及更加精確的推薦性能,解決了現(xiàn)有模型并不能完全捕獲文本信息,且模型精度較低,以及這些模型忽略了用戶的輔助信息以及隱式信息,因而不能更加準確的獲取用戶的喜好的問題。
綜上,若發(fā)明人能參考上述建議撰寫算法類(AI)的技術交底書,專利代理師撰寫出的專利申請文件,通常都能滿足客體要求,即“權利要求包含技術特征、記載了對要解決的技術問題采用了利用自然規(guī)律的技術手段、并且由此獲得符合自然規(guī)律的技術效果”。
(原標題:搭建專利授權的橋梁——教會發(fā)明人撰寫AI專利交底書)
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:陳會紅
編輯:IPRdaily趙甄 校對:IPRdaily縱橫君
注:原文鏈接:搭建專利授權的橋梁——教會發(fā)明人撰寫AI專利交底書(點擊標題查看原文)
「關于IPRdaily」
IPRdaily是全球領先的知識產權綜合信息服務提供商,致力于連接全球知識產權與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產權負責人,還有來自政府、律師及代理事務所、研發(fā)或服務機構的全球近100萬用戶(國內70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經IPRdaily.cn中文網(wǎng)編輯。轉載此文章須經權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉載,請注明出處:“http://jupyterflow.com”
文章不錯,犒勞下辛苦的作者吧