法律法律民法民法民法民法民法
#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng)#
原標(biāo)題:裁判文書網(wǎng)數(shù)據(jù)竟被商家標(biāo)價(jià)售賣
近日,記者從某網(wǎng)購(gòu)商城看到,最高人民法院裁判文書網(wǎng)的數(shù)據(jù)被標(biāo)價(jià)出售。裁判文書網(wǎng)發(fā)布的判決書都是公開的,為什么會(huì)被售賣?獲取數(shù)據(jù)的手段對(duì)于網(wǎng)站是否有危害呢?
網(wǎng)售數(shù)據(jù) 價(jià)格需“私聊”獲取
記者在某網(wǎng)絡(luò)商城中看到,有標(biāo)注來(lái)自湖南、廣東、山東等多地的商家均聲稱出售裁判文書網(wǎng)的數(shù)據(jù),其中不少商家聲稱其數(shù)據(jù)量超6000萬(wàn)條。而據(jù)裁判文書網(wǎng)公開數(shù)據(jù)顯示,目前裁判文書網(wǎng)上公開的文書總量為7395萬(wàn)多篇,如果商家所稱的數(shù)量屬實(shí),則商家能夠提供絕大多數(shù)已經(jīng)公開的文書數(shù)據(jù)。
販賣數(shù)據(jù)商家的推銷頁(yè)面
不少聲稱能夠出售裁判文書網(wǎng)數(shù)據(jù)的商家在商品文字描述中稱,其數(shù)據(jù)是通過(guò)“網(wǎng)絡(luò)爬蟲”的方式獲取的。所謂“網(wǎng)絡(luò)爬蟲”,又稱網(wǎng)頁(yè)蜘蛛、網(wǎng)頁(yè)機(jī)器人,是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。相當(dāng)于一個(gè)自動(dòng)訪問(wèn)網(wǎng)頁(yè)并進(jìn)行相關(guān)操作的小機(jī)器人。
記者注意到,盡管每名商家均在商品頁(yè)面標(biāo)示稱,其數(shù)據(jù)售價(jià)為0.1元至1元,但每名商家均在文字描述中表示,數(shù)據(jù)的售價(jià)并不以標(biāo)示為準(zhǔn),而是需要“私聊”獲取。
一名售賣裁判文書數(shù)據(jù)的商家說(shuō),購(gòu)買裁判文書數(shù)據(jù)的買家所需要的數(shù)據(jù)量從幾千篇到幾千萬(wàn)篇不等,有的買家是因?yàn)闊o(wú)法打開裁判文書網(wǎng)而不得不來(lái)求助于數(shù)據(jù)賣家,“還有很多學(xué)生買數(shù)據(jù)用于論文寫作,這種情況幾千條就夠了,商用的話可能需要幾百萬(wàn)條甚至上千萬(wàn)條?!?/strong>商家還稱,每個(gè)月他們能接到四五個(gè)文書數(shù)據(jù)采集的訂單,而價(jià)格和買家需要的數(shù)據(jù)量有關(guān),“幾百萬(wàn)條數(shù)據(jù)大概要幾千塊錢,現(xiàn)在加密技術(shù)很嚴(yán)格,所以要貴一些。”
“爬蟲”系統(tǒng) 曾致正常用戶無(wú)法訪問(wèn)
記者了解到,部分技術(shù)機(jī)構(gòu)通過(guò)網(wǎng)絡(luò)爬蟲系統(tǒng)獲取裁判文書網(wǎng)數(shù)據(jù)的行為,已經(jīng)給裁判文書網(wǎng)正常用戶的訪問(wèn)帶來(lái)了不便。不少網(wǎng)友曾在網(wǎng)上發(fā)帖稱,自己搜索裁判文書時(shí),常常遭遇裁判文書網(wǎng)網(wǎng)站顯示因?yàn)橄到y(tǒng)原因,無(wú)法查詢的情況。
對(duì)此,最高人民法院在其官網(wǎng)回應(yīng)網(wǎng)友對(duì)于裁判文書網(wǎng)運(yùn)行慢、故障頻繁等情況時(shí)表示,由于中國(guó)裁判文書網(wǎng)公開文書數(shù)量和影響力不斷增加,訪問(wèn)用戶數(shù)不斷增長(zhǎng)。同時(shí),2018年5月初以來(lái),大量技術(shù)公司通過(guò)爬蟲系統(tǒng)無(wú)限制并發(fā)訪問(wèn)非法獲取裁判文書數(shù)據(jù),造成網(wǎng)站負(fù)荷過(guò)大,大量正常用戶請(qǐng)求堵塞,訪問(wèn)出現(xiàn)速度慢或部分頁(yè)面無(wú)法顯示等現(xiàn)象。
今年5月,最高人民法院信息中心主任許建峰在接受媒體采訪時(shí)表示:“中國(guó)裁判文書網(wǎng)目前每天的訪問(wèn)量可以達(dá)到幾千萬(wàn)的量級(jí),其中還包括數(shù)據(jù)爬蟲的攻擊,我們的中心服務(wù)器承受著巨大壓力?!?/p>
“我們每時(shí)每刻都在監(jiān)控著它的應(yīng)用情況,希望遇到問(wèn)題立即采取措施,但是的確還不能完全跟得上步子,所以會(huì)出現(xiàn)停網(wǎng)維護(hù)運(yùn)營(yíng)的情況?!痹S建峰說(shuō),最高法已成立了專門的運(yùn)維保障團(tuán)隊(duì)去維護(hù)管理中國(guó)裁判文書網(wǎng),也將在技術(shù)與人力上投入更多的力量。
相關(guān)機(jī)構(gòu):已采用多種方式“反爬”
記者獲悉,此前,相關(guān)方面已采取多種方式,對(duì)抗“爬蟲技術(shù)”。最高人民法院曾發(fā)文稱,為更好地確保正常用戶訪問(wèn)性能,相關(guān)方面以驗(yàn)證碼的方式上線系統(tǒng)軟件防爬功能。“驗(yàn)證碼技術(shù)是防爬蟲的一種有效措施,當(dāng)瀏覽量在某段時(shí)間內(nèi)達(dá)到一定數(shù)量后,將啟用驗(yàn)證碼機(jī)制進(jìn)行核驗(yàn)。后續(xù),我們將不定期更新防爬蟲技術(shù),加強(qiáng)網(wǎng)站維護(hù),提高網(wǎng)站運(yùn)行效率和穩(wěn)定性?!?/p>
此外,針對(duì)網(wǎng)友提問(wèn),為何不能按照“公開時(shí)間”為檢索條件進(jìn)行裁判文書檢索時(shí),最高人民法院方面表示,暫沒(méi)有設(shè)置“公開時(shí)間”為檢索條件的主要原因是爬蟲系統(tǒng)會(huì)根據(jù)“公開時(shí)間”項(xiàng)進(jìn)行增量文書爬取,“待下一步防爬蟲系統(tǒng)穩(wěn)定、可靠運(yùn)行一段時(shí)間后,我們將適時(shí)考慮增加‘公開時(shí)間’檢索項(xiàng)。”
此外,最高人民法院方面稱:“由于前期爬蟲行為過(guò)于猖獗,無(wú)限制暴力訪問(wèn)大幅降低正常用戶訪問(wèn)性能,我們采取了通過(guò)限制列表頁(yè)面翻頁(yè)數(shù)量來(lái)防止爬蟲系統(tǒng)的措施?!?/p>
律師分析:強(qiáng)行突破“反爬”技術(shù)或構(gòu)成犯罪
金杜律師事務(wù)所從事IP類法律業(yè)務(wù)的律師瞿淼曾發(fā)文闡述了網(wǎng)絡(luò)爬蟲所涉及的法律問(wèn)題。瞿淼稱,從技術(shù)中立的角度而言,爬蟲技術(shù)本身并無(wú)違法違規(guī)之處。但是,隨著數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)爬取帶來(lái)的各種問(wèn)題和顧慮日漸增加。過(guò)于野蠻的爬蟲可能造成網(wǎng)站負(fù)荷過(guò)大,從而導(dǎo)致網(wǎng)站癱瘓、不能訪問(wèn)等。
“由于爬蟲的批量訪問(wèn)會(huì)給網(wǎng)站帶來(lái)巨大的壓力和負(fù)擔(dān),因此許多網(wǎng)站經(jīng)營(yíng)者會(huì)采取技術(shù)手段,以阻止爬蟲批量獲取自己網(wǎng)站信息。而針對(duì)這些技術(shù)手段,爬蟲開發(fā)者可以通過(guò)優(yōu)化自己的代碼、使用IP池等多種方式規(guī)避上述技術(shù)措施,實(shí)現(xiàn)對(duì)網(wǎng)站信息的批量抓取和復(fù)制?!宾捻嫡f(shuō),由于網(wǎng)絡(luò)爬蟲會(huì)根據(jù)特定策略盡可能多地訪問(wèn)頁(yè)面,因而爬蟲的使用將占用被訪問(wèn)網(wǎng)站的網(wǎng)絡(luò)帶寬并增加網(wǎng)絡(luò)服務(wù)器的處理開銷,甚至無(wú)法正常提供服務(wù)。
瞿淼認(rèn)為,根據(jù)《反不正當(dāng)競(jìng)爭(zhēng)法》關(guān)于網(wǎng)絡(luò)的相關(guān)條款,如果網(wǎng)站運(yùn)營(yíng)者已經(jīng)采取了一定的反爬蟲措施,而爬蟲控制者基于經(jīng)營(yíng)目的、強(qiáng)行突破網(wǎng)站運(yùn)營(yíng)者采取的反爬蟲技術(shù)措施,并客觀導(dǎo)致被抓取網(wǎng)站無(wú)法正常運(yùn)行,則可能構(gòu)成不正當(dāng)競(jìng)爭(zhēng)行為。此外,強(qiáng)行突破某些特定被爬方的技術(shù)措施,還可能構(gòu)成刑事犯罪行為。
針對(duì)此情況,北京市社會(huì)組織法律調(diào)解中心副理事長(zhǎng)張新年律師認(rèn)為,“這些裁判文書基于司法公開目的,是免費(fèi)的公共資源,未經(jīng)最高人民法院授權(quán),商家售賣裁判文書網(wǎng)數(shù)據(jù)構(gòu)成侵權(quán)?!?/p>
來(lái)源:北京青年報(bào)
記者:屈暢 朱健勇
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
推薦閱讀(點(diǎn)擊圖文,閱讀全文)
嘉賓寄語(yǔ)CPIPS 2019:相約第四屆中國(guó)醫(yī)藥知識(shí)產(chǎn)權(quán)峰會(huì)2019(10月23-25,上海)
官宣!首屆“全球科技創(chuàng)新與知識(shí)產(chǎn)權(quán)總裁研修班”招生簡(jiǎn)章
延期通知!尋找40位40歲以下企業(yè)知識(shí)產(chǎn)權(quán)精英(40 Under 40)活動(dòng)改期
“投稿”請(qǐng)投郵箱“iprdaily@163.com”
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶匯聚了中國(guó)、美國(guó)、德國(guó)、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司、成長(zhǎng)型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬(wàn)產(chǎn)業(yè)用戶(國(guó)內(nèi)25萬(wàn)+海外30萬(wàn));同時(shí)擁有近百萬(wàn)條高質(zhì)量的技術(shù)資源+專利資源,通過(guò)媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)北京青年報(bào)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://jupyterflow.com/”
文章不錯(cuò),犒勞下辛苦的作者吧