#本文僅代表作者觀點,不代表IPRdaily立場#
“首家向用戶開放免費注冊的生物序列商業(yè)數(shù)據(jù)庫?!?/strong>
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
引言
FTO(Freedom to Operate)專利檢索與分析是醫(yī)藥企業(yè)評估專利侵權(quán)風(fēng)險的有效手段,充分掌握并實施FTO專利檢索與分析有助于醫(yī)藥企業(yè)更好地降低風(fēng)險、減少損失。在進行FTO調(diào)查的過程中,檢索數(shù)據(jù)庫的選擇至關(guān)重要。FTO檢索是查全性檢索,如果選擇的數(shù)據(jù)庫檢索不全面,就會增加一定的侵權(quán)風(fēng)險,因此保證檢索式命中結(jié)果的全面性和準(zhǔn)確性,至關(guān)重要。
在生物醫(yī)藥領(lǐng)域FTO專利檢索中,除了利用專利數(shù)據(jù)庫構(gòu)建檢索式外,對于生物序列的檢索,還要使用特定的生物序列檢索工具進行檢索。
2023年6月,智慧芽旗下生物序列數(shù)據(jù)庫(簡稱"Bio")重磅上線全球首個通式序列比對算法,檢索專利中隱藏的“萬億序列”的通式序列。同年10月,Bio免費版正式上線并開放注冊。
現(xiàn)在掃碼立即搶先免費體驗!
一、通式序列檢索輻射萬億序列
背景:專利撰寫人員會在序列中引入簡并符、通配符和運算符等信息,并通過大段解釋性文檔描述這些符號的具體參數(shù)。通式序列并不具備生物學(xué)意義,它主要用于擴展專利的保護范圍并設(shè)置搜索障礙。傳統(tǒng)的序列同源性比對算法并沒有考慮到這種通式序列的情況,因此使用傳統(tǒng)算法進行搜索存在漏檢風(fēng)險,無法找出所有潛在目標(biāo)序列。
根據(jù)智慧芽生物序列數(shù)據(jù)庫統(tǒng)計顯示,在全球?qū)@墨I中,這種特殊的通式序列數(shù)量并不低:核酸約740萬條,占總核酸數(shù)的7.12%;蛋白序列131萬條,占總蛋白序列數(shù)的7.55%。這表明大量的通式序列,由于特殊符號的存在,會對檢索結(jié)果產(chǎn)生影響,對于序列FTO來說風(fēng)險非常高。
例如,查詢序列
"EVGSYPAPSDACPSDYFYCDASGRSAGGGGTENLYFQGSGGS",
在命中目標(biāo)序列時,
"EVGSYXXXXX XCXXXXXXCX XSGRSAGGGG TENLYFQGSG GS"。
使用傳統(tǒng)序列方式檢索,BLAST算法的相似度僅為67%,但實際上相似度為100%。這種生物序列通過常規(guī)算法搜索會導(dǎo)致兩種情況:要么序列無法搜索,要么由于相似度低于閾值而被排除在結(jié)果之外。無論哪種情況,都會給序列搜索人員帶來不便,無法方便地與權(quán)利要求進行同源性比較,甚至?xí)z關(guān)鍵序列信息。
為了解決通式序列帶來的漏檢風(fēng)險,智慧芽算法工程團隊利用自研的NLP、CV、實體識別、指代消解等技術(shù),構(gòu)建了深度學(xué)習(xí)模型,用于識別和解析序列表和專利全文中的通式序列及其取代信息,并建立了通式序列檢索庫。
圖:智慧芽生物序列數(shù)據(jù)庫通式序列檢索入口
該庫通過特殊的序列比對算法,在通式序列檢索時不僅能夠搜索這類序列,還能返回真實的相似度。智慧芽的通式序列檢索解決方案能夠進一步降低在專利FTO和查新工作中的漏檢風(fēng)險。
圖:智慧芽生物序列數(shù)據(jù)庫通式序列檢索示意
二、Bio免費版全面開放注冊
常見的公共免費序列檢索數(shù)據(jù)庫,往往存在專利數(shù)據(jù)收錄不全、算法以及保密等問題,不適合用于嚴(yán)謹(jǐn)?shù)姆狼謾?quán)分析。所以,在進行FTO專利檢索與分析時,常選擇數(shù)據(jù)收錄和算法均能滿足防侵權(quán)分析的商業(yè)數(shù)據(jù)庫進行序列檢索。智慧芽Bio作為主流商業(yè)數(shù)據(jù)庫之一,今年10月重磅宣布免費版正式上線并開放注冊。歡迎新老用戶掃碼注冊使用!
無論您是致力于開發(fā)新型癌癥治療方法的生物科學(xué)家,希望了解可能影響藥物反應(yīng)的不同序列變異,還是需要進行成果序列可專利性分析及FTO工作的知識產(chǎn)權(quán)律師,智慧芽生物序列數(shù)據(jù)庫均是幫助您解鎖和理解復(fù)雜生物序列的重要工具。
免費版權(quán)限:常規(guī)搜索、短序列搜索、Motif搜索各5次、可使用變異過濾查看變異報告、可查看來自序列索引專利、序列索引公開庫、人工標(biāo)注序列的50條序列詳情。
免費版申請及使用入口:bio.zhihuiya.com
數(shù)據(jù)全面準(zhǔn)確:智慧芽生物序列數(shù)據(jù)庫收錄海量全球生物序列相關(guān)數(shù)據(jù),并基于AI與人工標(biāo)注數(shù)據(jù),高效保障準(zhǔn)確性,滿足用戶的序列檢索分析需求。
功能豐富:
功能:通式檢索、常規(guī)檢索、短序列檢索、Motif搜索、片段搜索、組合檢索、抗體搜索、藥物/基因索引
工具:序列助手、序列比對、工作空間、郵件提醒、sequence_suite、高級設(shè)置、過濾篩選
圖:智慧芽生物序列數(shù)據(jù)庫功能
圖:抗體檢索結(jié)果
圖:序列助手示意圖
檢索清晰便捷:檢索簡單易上手,界面友好,數(shù)據(jù)庫部分界面截圖如下:
現(xiàn)在掃碼立即搶先免費體驗!
為了提升您的檢索體驗
電腦端請訪問生物序列數(shù)據(jù)庫官網(wǎng)
bio.zhihuiya.com
生物序列專利檢索場景案例
CAR-T領(lǐng)域有哪些檢索方式能找到更多更全的技術(shù)資料和專利信息
(原標(biāo)題:智慧芽生物序列數(shù)據(jù)庫「通式序列+免費版」王炸組合等你來?。?br/>
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
編輯:IPRdaily辛夷 校對:IPRdaily縱橫君
注:原文鏈接:免費試用!智慧芽上線全球首個通式序列比對算法,檢索專利中隱藏的“萬億序列”的通式序列(點擊標(biāo)題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://jupyterflow.com”
巔峰對決!2023年灣高賽決賽評選暨百強頒獎在廣州成功舉辦
#晨報#金力股份起訴上海恩捷專利侵權(quán),要求賠償1.49億元;“西方臻選”回應(yīng)賬號被封,多方搶注西方、南方、北方甄選商標(biāo)
文章不錯,犒勞下辛苦的作者吧