產(chǎn)業(yè)統(tǒng)計
來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
原標(biāo)題:打假黑科技之三——拄雙拐的阿里打假工程師:用大數(shù)據(jù)鍛造出世上最鋒利的打假尖刀
80年前,人們開始用計算機預(yù)測天氣。如今,阿里巴巴的年輕工程師們,正用機器學(xué)習(xí)等大數(shù)據(jù)方法阻擊假貨。夾雜在政策、法律、經(jīng)濟、社會發(fā)展乃至人性中間,假貨治理的難度也許比變化無常的天氣更為復(fù)雜。
拄著雙拐的笑舒(阿里花名)來自湖北孝感,他是架設(shè)打假大數(shù)據(jù)攔截網(wǎng)的阿里巴巴工程師之一。建設(shè)這張“網(wǎng)”的路一點都不平坦,這讓他無數(shù)次想起10年前,父親用三輪車載著他上學(xué)的那條土路:是“挑戰(zhàn)”讓人找到自己的價值。
在笑舒和同事們的努力下,他們研發(fā)的打假大數(shù)據(jù)模型每天對整個阿里平臺近20億件商品進行掃描,找出疑似售假商家做出處理,協(xié)助執(zhí)法部門進行查處。
2017年的前11個月里,他們協(xié)助執(zhí)法機關(guān)破獲制售假案件674個。
拄雙拐的打假工程師
12月5日,晚8點,杭州阿里巴巴西溪園區(qū),辦公樓燈火通明。
笑舒坐在被三臺顯示器環(huán)繞的工位上,與身邊的同事一齊修改、調(diào)試大數(shù)據(jù)打假模型。
如果不是一副放在工位旁的拐杖,沒人會注意笑舒的不同。
“這是主模型,我們應(yīng)對各種業(yè)務(wù)場景準(zhǔn)不準(zhǔn),今后就看它了?!毙κ嬲f,他和同事們開發(fā)的大數(shù)據(jù)打假模型包含了上千個數(shù)據(jù)維度,僅代碼量便有數(shù)十萬行。
在屏幕上,笑舒能讓代碼飛奔,在現(xiàn)實生活中,他只能靠雙拐緩慢向前。
笑舒一歲時被確診患有小兒麻痹癥,左腿相比常人瘦弱一圈。
圖說:每天笑舒都乘他的代步車進入園區(qū)
笑舒該如何生存下去?一度讓在湖北孝感務(wù)農(nóng)的父母感到憂慮。最終,父母決定送笑舒上學(xué)?!啊灰憧蠈W(xué),我就供你讀?!@是母親跟我說過最重的一句話。”笑舒回憶,從初中到高中,父親每天騎著三輪車接送他上下學(xué)。
“從我家到學(xué)校都是土路,父親送我上學(xué)每趟都要騎半個小時,父母很辛苦。所以我對自己很嚴(yán)格,基本上都是年級前五名?!毙κ嬲f。
2008年,笑舒考入了湖北工業(yè)大學(xué),2012年,考入華中科技大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,并于2014年獲得碩士學(xué)位。
上學(xué)的路已是艱難,更讓他覺得難的,是他第一次從學(xué)校走向社會求生。
“一開始,我打算在武漢找一份工作,很多武漢公司對我簡歷認(rèn)可,但一面試便以‘你的身體狀況可能不太適合這邊’婉拒了我。其實與阿里的工作相比,武漢的那份工作更機械化,沒挑戰(zhàn)性。或許也不是我想干的,但他們真要錄用了我,我現(xiàn)在應(yīng)該就在武漢了?!毙κ婊貞?。
因為技術(shù)過硬,他最終經(jīng)過校招面試,成為一名阿里巴巴數(shù)據(jù)工程師。
好刀鋒自磨礪,大數(shù)據(jù)鍛造世上僅有的打假模型
“我在阿里打假不是做‘判官’,而是利用機器學(xué)習(xí)、做數(shù)據(jù)模型過濾負(fù)向商品和商家,排除潛在風(fēng)險。”每當(dāng)有人問他在阿里做什么,笑舒總要把上面的話大致重復(fù)一遍。
大家不懂什么是打假模型,笑舒并不覺得奇怪。因為他和同事們所做的,就是探索一套世界上絕無僅有的假貨風(fēng)控體系——面對近20億量級的商品,上千萬賣家,數(shù)以億計的訂單。
“這種模型,世界上之前沒有過。從業(yè)界來看,一般利用機器學(xué)習(xí)做的都是正向模型居多,像營銷、推廣。但我們做的是負(fù)向模型,且是信息量龐大,維度眾多的場景。”笑舒說,從他開始研發(fā)打假模型便面臨眾多壓力與挑戰(zhàn):打假模型判斷不準(zhǔn),出問題他和伙伴們要負(fù)責(zé)。
一次有商家被投訴售假,但從信息層面看不出其是否售賣過假貨,這時受理投訴的同事調(diào)用笑舒研發(fā)的假貨模型進行甄別,結(jié)果模型判斷售假嫌疑極大。
而多次抽檢后顯示,該商家售賣的是正品,這曾使笑舒的打假模型備受質(zhì)疑。
這事之后,笑舒和團隊深入分析了原因,發(fā)現(xiàn)是作為機器學(xué)習(xí)的原料——種子數(shù)據(jù)特征的覆蓋面不夠。在調(diào)整了數(shù)據(jù)樣本、特征和模型后,同類商品的售假判斷準(zhǔn)確性得到極大提高,得到調(diào)用部門的認(rèn)可。
圖說:為便于調(diào)試代碼,笑舒的工位放置了多臺顯示器。
好刀都是磨礪出來的。經(jīng)歷了眾多挑戰(zhàn)后,如今,笑舒和同事們研發(fā)的大數(shù)據(jù)打假模型已應(yīng)用在神秘抽檢、疑似售假商家入駐攔截、售假線索挖掘分析等阿里巴巴平臺治理部眾多的假貨風(fēng)控場景中。
“阿里巴巴發(fā)布‘打假地圖’哪里是‘重災(zāi)’省份”、“阿里協(xié)助滬警方打假:繳獲假冒品牌紅酒14000瓶 案值逾千萬元”,這些新聞報道背后,是這套打假模型在高效運轉(zhuǎn)。
據(jù)《2016年阿里巴巴平臺治理年報》顯示,從2016年1月至2016年12月,阿里巴巴協(xié)助警方抓獲犯罪嫌疑人880名;搗毀涉假窩點1419 個;破獲案件涉案總金額超 30 億元。在品牌合方面,這一年阿里巴巴主動攔截刪除的商品量是同期權(quán)利人投訴刪除商品量的26倍。這些數(shù)字同樣離不開打假模型的支撐。
笑舒表示,以前他和同事會根據(jù)不同的場景、商品數(shù)據(jù)設(shè)計打假模型。這些模型經(jīng)過一段時間的調(diào)試和發(fā)育,上線初期命中率很高。然而,眾多售假團伙會試探打假模型的能力,進而讓假貨信息、售假者身份“變異”來繞過監(jiān)管。
常規(guī)做法是對模型參數(shù)、特征和種子數(shù)據(jù)進行調(diào)整,讓模型盡快能識別變異的商品信息。但在模型調(diào)整期間,不免有漏網(wǎng)之魚溜進平臺。為此,笑舒和同事們正在抓緊調(diào)整一個有數(shù)十萬行代碼的主模型,該模型包含了上千個數(shù)據(jù)維度。笑舒表示,隨著這個模型的成熟,阿里巴巴平臺治理部攔截和打擊假貨將更為高效,有望從信息層面讓假貨從阿里巴巴平臺上基本消失。
雖然能從信息層面消滅假貨,但笑舒和同事清楚,線下的假貨并不會憑空蒸發(fā)。更加嚴(yán)峻的問題,不少線下制假團伙并沒有得到應(yīng)有的懲罰,這就導(dǎo)致平臺面對的假貨威脅一直嚴(yán)峻。
“當(dāng)前打假就像個篩子,刑事判決處罰過低,不足以震懾利潤豐厚的制假售假產(chǎn)業(yè)鏈。”據(jù)阿里巴巴首席平臺治理官鄭俊芳介紹,2016年阿里巴巴平臺治理部共排查出4495個銷售額遠大于起刑點(5萬元)的制售假線索,而通過公開信息能夠確認(rèn)已經(jīng)有刑事判決結(jié)果的僅33例,緩刑比率近80%。因此,在今年兩會期間,馬云致信兩會代表委員,呼吁“像抓酒駕一樣治理假貨”,引起全社會強烈反響。
圖說:阿里巴巴呼吁“像抓酒駕一樣打假”
“‘像抓酒駕一樣治理假貨’最終目的是讓售假者得到應(yīng)有處罰,減少社會上的假貨。我們團隊最大的KPI(績效指標(biāo))應(yīng)該就是利用打假模型,為全社會營造出‘無假’的貿(mào)易環(huán)境?!闭f起即將到來的2018年,笑舒表示他最大的心愿是父母平安健康,天下沒有假貨。
來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
編輯:IPRdaily趙珍 校對:IPRdaily縱橫君
“投稿”請投郵箱“iprdaily@163.com”
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺,致力于連接全球知識產(chǎn)權(quán)人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬產(chǎn)業(yè)用戶(國內(nèi)25萬+海外30萬);同時擁有近百萬條高質(zhì)量的技術(shù)資源+專利資源,通過媒體構(gòu)建全球知識產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://jupyterflow.com/”
文章不錯,犒勞下辛苦的作者吧