#本文僅代表作者觀(guān)點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:北京專(zhuān)獵前沿技術(shù)有限公司
原標(biāo)題:是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述
從上世紀(jì)60年代算起,計(jì)算機(jī)視覺(jué)的歷史也不過(guò)半個(gè)多世紀(jì),跟整個(gè)人類(lèi)歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺(jué)已經(jīng)從最開(kāi)始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來(lái)5G帶來(lái)的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺(jué)的發(fā)展和應(yīng)用更有著充滿(mǎn)想象的巨大空間。
何為計(jì)算機(jī)視覺(jué)
從2016年AlphaGo以4:1戰(zhàn)勝世界圍棋冠軍李世石到2017年人工智能被正式寫(xiě)入國(guó)家“十三五”規(guī)劃綱要,再到2021年“十四五”規(guī)劃將人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級(jí)”,人工智能已在風(fēng)口迎風(fēng)飛翔多年,成為當(dāng)下最熱門(mén)的科學(xué)技術(shù)。作為人工智能的三大核心技術(shù)之一(另外兩項(xiàng)為自然語(yǔ)言處理和語(yǔ)音識(shí)別),計(jì)算機(jī)視覺(jué)更是迎來(lái)了蓬勃發(fā)展。
日常生活中,我們經(jīng)常使用的人臉解鎖、刷臉支付、人臉身份驗(yàn)證、智能美顏、拍攝背景虛化等,其背后都是計(jì)算機(jī)視覺(jué)技術(shù)在支撐。除此之外,公共安防、無(wú)人駕駛、醫(yī)療診斷、文化旅行、教育、農(nóng)業(yè)等領(lǐng)域,都有計(jì)算機(jī)視覺(jué)的身影,可以說(shuō)計(jì)算機(jī)視覺(jué)在商業(yè)化應(yīng)用上已百花齊放,滲透到生活的方方面面。根據(jù)Tractica預(yù)測(cè),到2025年,全球計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模(包括軟件、硬件和服務(wù)收入)將從2016年的11億美元增長(zhǎng)到262億美元。
圖 1 2016-2025年計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模_Tractica預(yù)測(cè)數(shù)據(jù)
數(shù)據(jù)來(lái)源:Tractica
何為計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)是以圖像(視頻)為輸入,以對(duì)環(huán)境的表達(dá)(representation)和理解為目標(biāo),研究圖像信息組織、物體和場(chǎng)景識(shí)別、進(jìn)而對(duì)事件給予解釋的學(xué)科。計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容,大體可以分為物體視覺(jué)(object vision)和空間視覺(jué)(spatial vision)兩大部分。物體視覺(jué)在于對(duì)物體進(jìn)行精細(xì)分類(lèi)和鑒別,而空間視覺(jué)在于確定物體的位置和形狀,為“動(dòng)作(action)”服務(wù)。從本質(zhì)上講,計(jì)算機(jī)視覺(jué)就是研究視覺(jué)感知問(wèn)題,“賦予機(jī)器自然視覺(jué)能力”。
透過(guò)專(zhuān)利看計(jì)算機(jī)視覺(jué)的發(fā)展史
圖 2 全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)趨勢(shì)
圖 3 全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)主要受理局分布
注:由于發(fā)明專(zhuān)利申請(qǐng)的公開(kāi)相對(duì)于申請(qǐng)日而言有滯后期,一般為18個(gè)月,因而2019、2020年的專(zhuān)利申請(qǐng)尚有部分未公開(kāi),與實(shí)際情況相比,其數(shù)據(jù)有一定程度的偏低。
同其他科學(xué)技術(shù)一樣,計(jì)算機(jī)視覺(jué)的發(fā)展也是由最初的萌芽期一路走到了如今的井噴發(fā)展期(圖2)。
技術(shù)萌芽期
20世紀(jì)60年代,尤其是1965年以后,是計(jì)算機(jī)視覺(jué)的技術(shù)萌芽期。1966年,人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中,要求學(xué)生通過(guò)編寫(xiě)一個(gè)程序讓計(jì)算機(jī)告訴我們它通過(guò)攝像頭看到了什么,這被認(rèn)為是計(jì)算機(jī)視覺(jué)最早的任務(wù)描述[1]。從此,計(jì)算機(jī)視覺(jué)的研究序幕拉開(kāi),并將迎來(lái)屬于它自己的跌宕起伏波瀾壯闊的歷史篇章。
1965年-1968年,全球計(jì)算機(jī)視覺(jué)相關(guān)專(zhuān)利申請(qǐng)總數(shù)在2000篇以下,并以每年百篇左右的數(shù)量遞增著。這一時(shí)期的研究集中在美歐兩地(圖3),美國(guó)的IBM一枝獨(dú)秀,是最主要的研究企業(yè);其次為德國(guó)的西門(mén)子(圖4)。
圖 4 1965-1968年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15
慢速增長(zhǎng)期
20世紀(jì)60年代末至90年代,隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn)以及對(duì)計(jì)算機(jī)視覺(jué)研究的深入,人們開(kāi)始嘗試不同的算法。計(jì)算機(jī)視覺(jué)研究進(jìn)入了相對(duì)慢速但“百家爭(zhēng)鳴”般的增長(zhǎng)期,全球?qū)@暾?qǐng)數(shù)量以年均10%左右的速度增長(zhǎng)。
雖然在七十年代中期美國(guó)的MIT人工智能實(shí)驗(yàn)室正式開(kāi)設(shè)計(jì)算機(jī)視覺(jué)課程,在1982年英國(guó)的David Marr發(fā)表了《視覺(jué)》一書(shū),標(biāo)志著計(jì)算機(jī)視覺(jué)成為一門(mén)獨(dú)立學(xué)科,但是計(jì)算機(jī)視覺(jué)的研究已經(jīng)西風(fēng)東漸,日本成為全球最主要、最大的研究地。從1970到1990年左右,全球50%以上的專(zhuān)利申請(qǐng)都出自日本,而同時(shí)期美國(guó)的專(zhuān)利申請(qǐng)數(shù)量占全球?qū)@暾?qǐng)總數(shù)的10%不到,而且無(wú)論是專(zhuān)利申請(qǐng)數(shù)量還是專(zhuān)利申請(qǐng)?jiān)鲩L(zhǎng)速度,日本都遠(yuǎn)超歐美(圖3)。即使1990年以后,美國(guó)的研究開(kāi)始發(fā)力,歷年專(zhuān)利申請(qǐng)數(shù)量呈線(xiàn)性增加,歐洲和韓國(guó)地區(qū)的專(zhuān)利申請(qǐng)數(shù)量也在逐年遞增,但是日本的專(zhuān)利申請(qǐng)數(shù)量依然占有絕對(duì)優(yōu)勢(shì)。這一時(shí)期,在全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前15的企業(yè)中,除美國(guó)的IBM(第7)和荷蘭的皇家飛利浦(第14)外,其余全是日本企業(yè)(圖5),佳能、東芝、日立、富士通、日本電氣等響當(dāng)當(dāng)?shù)钠髽I(yè)高居榜單前5。
另外,現(xiàn)代CNN網(wǎng)絡(luò)中卷積層+池化層的最初范例及靈驗(yàn)來(lái)源,世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)——Neocognitron[2],也是由日本計(jì)算科學(xué)家Kunihiko Fukushima在1980年提出的??梢哉f(shuō),這是屬于日本的高光時(shí)刻。
圖 5 1969-1999全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)top15
平穩(wěn)過(guò)渡期
21世紀(jì)前10年,得益于計(jì)算機(jī)算力的飛躍式提升,以及互聯(lián)網(wǎng)和社交媒體的發(fā)展,全球數(shù)據(jù)達(dá)到ZB級(jí)別,計(jì)算機(jī)視覺(jué)的算法研究從“百家爭(zhēng)鳴”逐漸聚焦到機(jī)器學(xué)習(xí)。計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)經(jīng)過(guò)世紀(jì)初的猛增后,進(jìn)入一個(gè)平穩(wěn)過(guò)渡期,歷年的專(zhuān)利申請(qǐng)數(shù)量基本沒(méi)有增加,徘徊在35000件左右。雖然這一時(shí)期全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前15中,日本企業(yè)依然占有11席(圖6),但日本專(zhuān)利申請(qǐng)的歷年數(shù)量呈下降趨勢(shì),計(jì)算機(jī)視覺(jué)的研發(fā)由集中在日本漸漸地轉(zhuǎn)向以美歐日韓為主的多地發(fā)展(圖3)。荷蘭的皇家飛利浦在醫(yī)療健康領(lǐng)域的重點(diǎn)突破,美國(guó)的微軟在中國(guó)設(shè)立微軟亞洲研究院專(zhuān)門(mén)研究計(jì)算機(jī)視覺(jué),以及韓國(guó)的三星經(jīng)過(guò)20世紀(jì)90年代的研究積累,使得他們躋身進(jìn)2000-2009年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前10(圖6)。
圖 6 2000-2009年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15
同一時(shí)期,大洋彼岸的中國(guó),雖然專(zhuān)利申請(qǐng)數(shù)量在逐年增加,但其專(zhuān)利申請(qǐng)基本來(lái)自諸如索尼、皇家飛利浦、三星、微軟等海外巨頭在中國(guó)的布局,中國(guó)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15中,還沒(méi)有中國(guó)企業(yè)的名字(圖7)。中國(guó)企業(yè)的計(jì)算機(jī)視覺(jué)研究還處于萌芽狀態(tài)。
圖 7 2000-2009年中國(guó)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)top15
這段時(shí)間,具有標(biāo)志性的事件為:
2006年,Geoffrey Hinton教授提出了深度學(xué)習(xí)的概念,并通過(guò)逐層訓(xùn)練的方法解決了深度神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的問(wèn)題[2]。
2009年,李飛飛教授等在CVPR2009上發(fā)表了一篇名為《ImageNet: A Large-Scale Hierarchical Image Database》的論文,發(fā)布了ImageNet數(shù)據(jù)集,這是為了檢測(cè)計(jì)算機(jī)視覺(jué)能否識(shí)別自然萬(wàn)物,回歸機(jī)器學(xué)習(xí),克服過(guò)擬合問(wèn)題,經(jīng)過(guò)三年多籌劃組建完成的一個(gè)大的數(shù)據(jù)集。ImageNet是計(jì)算機(jī)視覺(jué)發(fā)展的重要推動(dòng)者,和深度學(xué)習(xí)熱潮的關(guān)鍵推動(dòng)者,將目標(biāo)檢測(cè)算法推向了新的高度[3]。
快速增長(zhǎng)期
2010-2015年,計(jì)算機(jī)的算力遵循著“摩爾定律”穩(wěn)步提升,互聯(lián)網(wǎng)及社交媒體的進(jìn)一步普及帶來(lái)爆發(fā)式增長(zhǎng)的大數(shù)據(jù),深度學(xué)習(xí)算法開(kāi)始流行,成為計(jì)算機(jī)視覺(jué)領(lǐng)域最主要的算法。計(jì)算機(jī)視覺(jué)也進(jìn)入了一個(gè)快速發(fā)展期,全球?qū)@暾?qǐng)數(shù)量以年均17%左右的速度增長(zhǎng)。其中,美國(guó)專(zhuān)利申請(qǐng)數(shù)量的年均增長(zhǎng)率約為23%,美國(guó)正式取代日本,成為計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)量最大的國(guó)家。在2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前10名中,美國(guó)企業(yè)占5席,分別為微軟(第2),谷歌(第5),高通(第6),IBM(第7)和Intel(第9)。中國(guó)專(zhuān)利申請(qǐng)數(shù)量更是以年均33%左右的速度增長(zhǎng),中國(guó)企業(yè)的計(jì)算機(jī)視覺(jué)研究也從小芽長(zhǎng)成了一棵小苗。2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15名榜單中,也首次出現(xiàn)了中國(guó)企業(yè)的身影:聯(lián)想,第15(圖8)。此外,韓國(guó)的三星依靠其龐大的家電和手機(jī)產(chǎn)品整合計(jì)算機(jī)視覺(jué)技術(shù),高居榜首位置;日本的索尼、佳能、富士通、日本電氣、理光等5家企業(yè)也榜上有名。
圖 8 2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15
這一時(shí)期,具有里程碑式的標(biāo)志事件為[3]:
2012年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創(chuàng)造了一個(gè)“大型的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)”,也即現(xiàn)在眾所周知的AlexNet,將圖像識(shí)別錯(cuò)誤率降低了10%,贏(yíng)得了當(dāng)年的 ILSVRC競(jìng)賽(是機(jī)器視覺(jué)領(lǐng)域最受追捧也是最具權(quán)威的學(xué)術(shù)競(jìng)賽之一,代表了圖像領(lǐng)域的最高水平)這是史上第一次有模型在 ImageNet 數(shù)據(jù)集表現(xiàn)如此出色。自那時(shí)起,CNN成了家喻戶(hù)曉的名字。
2014年,蒙特利爾大學(xué)提出生成對(duì)抗網(wǎng)絡(luò)(GAN):擁有兩個(gè)相互競(jìng)爭(zhēng)的神經(jīng)網(wǎng)絡(luò)可以使機(jī)器學(xué)習(xí)得更快。一個(gè)網(wǎng)絡(luò)嘗試模仿真實(shí)數(shù)據(jù)生成假的數(shù)據(jù),而另一個(gè)網(wǎng)絡(luò)則試圖將假數(shù)據(jù)區(qū)分出來(lái)。
井噴發(fā)展期
2016年及以后,計(jì)算機(jī)視覺(jué)技術(shù)逐漸賦能各行業(yè),應(yīng)用場(chǎng)景紛紛落地。廣闊的商業(yè)化應(yīng)用為計(jì)算機(jī)視覺(jué)的發(fā)展注入強(qiáng)勁動(dòng)力,至此,計(jì)算機(jī)視覺(jué)領(lǐng)域的研究進(jìn)入井噴狀態(tài),如春風(fēng)拂地萬(wàn)物在不經(jīng)意間復(fù)蘇一般,全球的研發(fā)格局也在悄然地發(fā)生變化。
2016-2018年間,全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)年均增長(zhǎng)率超過(guò)20%(2019及2020年的因?qū)@暾?qǐng)到公開(kāi)的時(shí)間遲滯原因,在此未統(tǒng)計(jì)),中美日韓歐成為主要的研發(fā)陣地。其中,中國(guó)專(zhuān)利申請(qǐng)的年均增長(zhǎng)率超過(guò)40%,貢獻(xiàn)了全球最主要的專(zhuān)利申請(qǐng)?jiān)鲩L(zhǎng),同時(shí),中國(guó)也超越美國(guó),成為新一屆的專(zhuān)利申請(qǐng)最大的國(guó)家。2016-2020年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15名中,美國(guó)企業(yè)5家、日本企業(yè)3家、韓國(guó)企業(yè)1家,而中國(guó)企業(yè)有6家,開(kāi)始占據(jù)明顯地位。這6家中國(guó)企業(yè)分別是騰訊(第2),OPPO(第5),平安科技(第11),華為(第12),阿里巴巴(第14)和商湯科技(第15)。騰訊和OPPO更是超過(guò)微軟、佳能、索尼等老牌企業(yè),躋身進(jìn)前5(圖9)。
作為國(guó)內(nèi)的傳統(tǒng)互聯(lián)網(wǎng)巨頭,一直以推動(dòng)科技創(chuàng)新為愿景的騰訊充分集成利用自身的數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ),打造出風(fēng)靡全國(guó)的人工智能系統(tǒng)和平臺(tái)。旗下的騰訊優(yōu)圖實(shí)驗(yàn)室從2012年開(kāi)始專(zhuān)注計(jì)算機(jī)視覺(jué)技術(shù)研發(fā),其在2017年研發(fā)出的“優(yōu)圖祖母模型”以及“目標(biāo)關(guān)聯(lián)算法”在多個(gè)比賽中排名第一甚至刷新世界紀(jì)錄;在2020年輸出超過(guò)50篇優(yōu)秀論文,入選多個(gè)行業(yè)頂級(jí)學(xué)術(shù)會(huì)議,內(nèi)容涵蓋目標(biāo)跟蹤、行人重識(shí)別、視頻識(shí)別等多個(gè)熱門(mén)及前沿領(lǐng)域。
以拍照手機(jī)出名的OPPO已在圖像處理上深耕多年,2012年OPPO首次在手機(jī)自拍上實(shí)現(xiàn)了美顏拍攝功能,開(kāi)創(chuàng)了“手機(jī)自拍美顏”時(shí)代;2018年,OPPO研究院在深圳成立,計(jì)算機(jī)視覺(jué)是其重要的研究方向之一;2020年的全球計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議CVPR (Conference on Computer Vision and Pattern Recognition) 上,OPPO共獲兩項(xiàng)第一,兩項(xiàng)第三。
圖 9 2016-2020年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15
總體來(lái)說(shuō),這一時(shí)期的美國(guó)引領(lǐng)著主流技術(shù)發(fā)展方向;日本的高光時(shí)刻已經(jīng)一去不復(fù)返,韓國(guó)靠著三星撐起半邊天,而中國(guó)的計(jì)算機(jī)視覺(jué)研究從小苗開(kāi)始生長(zhǎng)出更多的枝丫。
最新的計(jì)算機(jī)視覺(jué)研發(fā)格局
分析2020年公開(kāi)的計(jì)算機(jī)視覺(jué)領(lǐng)域的專(zhuān)利申請(qǐng)情況,得以管中窺豹,了解最新的計(jì)算機(jī)視覺(jué)研發(fā)格局。
國(guó)際格局
圖 10 2020年公開(kāi)的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15
2020年公開(kāi)的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)中,中美日韓的企業(yè)占據(jù)著專(zhuān)利申請(qǐng)數(shù)量的前15(圖10),其中美國(guó)企業(yè)5家,日本企業(yè)2家,韓國(guó)企業(yè)2家,中國(guó)企業(yè)6家。得益于國(guó)內(nèi)新基建的建設(shè)以及豐富的計(jì)算機(jī)視覺(jué)應(yīng)用場(chǎng)景,中國(guó)在企業(yè)數(shù)量和專(zhuān)利申請(qǐng)數(shù)量上大有后來(lái)追上之勢(shì)。
前10名的申請(qǐng)人中:
韓國(guó)的三星因其廣泛的產(chǎn)品線(xiàn)使得計(jì)算機(jī)視覺(jué)擁有廣闊的落地場(chǎng)景,其專(zhuān)利申請(qǐng)數(shù)量穩(wěn)列第一位。美國(guó)的IBM、微軟、谷歌、蘋(píng)果分別位于第3、4、5和第9位。IBM一直注重人工智能方面的基礎(chǔ)性研究,從20世紀(jì)60年代開(kāi)始就已經(jīng)是計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15榜單中的???;微軟和谷歌是目前人工智能技術(shù)的領(lǐng)軍企業(yè),他們掌握和引領(lǐng)著主流技術(shù)方向,目前全球的人工智能開(kāi)發(fā)方案中有相當(dāng)大的比例是基于微軟、谷歌等發(fā)布的基礎(chǔ)框架型構(gòu)架而進(jìn)行的;蘋(píng)果在2010年以后收購(gòu)了十幾家人工智能公司,將人工智能服務(wù)于自身的系列產(chǎn)品,提高現(xiàn)有產(chǎn)品體驗(yàn)。日本的索尼與佳能分別位于第6和第7位。他們是傳統(tǒng)的光學(xué)產(chǎn)品大廠(chǎng),計(jì)算機(jī)圖像處理方面有深厚的研發(fā)底蘊(yùn),其研發(fā)實(shí)力在上世紀(jì)七八十年代已經(jīng)顯現(xiàn)。
中國(guó)的企業(yè)除前面提到的騰訊、OPPO分別位列第2和第8外,成立于2014年的商湯科技以迅雷之勢(shì)超過(guò)美國(guó)的Intel、日本的富士通和國(guó)內(nèi)的華為、平安科技,進(jìn)入前10名,在一眾國(guó)內(nèi)外聲名顯赫的科技巨頭企業(yè)中格外顯眼。而商湯科技的成績(jī)不止于此:2018年,商湯科技被中國(guó)科技部指定為首個(gè)“智能視覺(jué)”國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái);2019年的ICCV (the International Conference on Computer Vision) 上,商湯科技及其聯(lián)合實(shí)驗(yàn)室以入選57篇論文的成績(jī)備受矚目;2020年的CVPR上,商湯科技的入選論文數(shù)超過(guò)微軟、Facebook等科技巨頭,并拿下了CVPR2020 ActivityNet 時(shí)空動(dòng)作定位賽道、動(dòng)作分類(lèi)賽道,以及 CVPR 2020 NTIRE 競(jìng)賽等3項(xiàng)世界冠軍。自成立以來(lái),商湯科技已在各種重要賽事中,斬獲了60多個(gè)世界第一。
國(guó)內(nèi)格局
圖10中上榜的6家中國(guó)企業(yè),在一定程度上體現(xiàn)出了我國(guó)計(jì)算機(jī)視覺(jué)的研究格局:這6家企業(yè)中,有擁有數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭BAT(百度,阿里巴巴,騰訊),有擁有龐大智能應(yīng)用終端承載計(jì)算機(jī)視覺(jué)技術(shù)的OPPO、華為(根據(jù)國(guó)際知名市場(chǎng)分析機(jī)構(gòu)Counterpoint的數(shù)據(jù)顯示:2021年1月OPPO、華為為國(guó)內(nèi)前二智能手機(jī)品牌,分別占據(jù)國(guó)內(nèi)智能手機(jī)份額的21%和20%),以及有專(zhuān)注于計(jì)算機(jī)視覺(jué)基礎(chǔ)研究與應(yīng)用的商湯科技。這些企業(yè),代表了國(guó)內(nèi)計(jì)算機(jī)視覺(jué)的最新、最強(qiáng)的研究實(shí)力。
另一方面,企業(yè)的海外專(zhuān)利申請(qǐng)是為其業(yè)務(wù)拓展保駕護(hù)航,海外布局策略和其業(yè)務(wù)拓展策略是一致的。2020年公開(kāi)的專(zhuān)利申請(qǐng)中,中國(guó)企業(yè)在中國(guó)大陸之外的專(zhuān)利申請(qǐng)量排名前5名分別為騰訊、華為、阿里巴巴、OPPO、商湯科技(圖11)。騰訊和阿里巴巴在中國(guó)大陸之外的布局策略比較一致,中國(guó)香港為其主要布局地,其次為專(zhuān)利五局中的美日韓歐。華為在中國(guó)大陸之外布局策略主要在專(zhuān)利五局中的美日韓歐,美歐為主場(chǎng)。OPPO與商湯科技在中國(guó)大陸之外布局策略類(lèi)似,除了美日韓歐外,在中國(guó)香港、中國(guó)臺(tái)灣等地也有較多的布局,但相較起來(lái),商湯科技在中國(guó)大陸之外布局更加均衡,在一些未來(lái)新興市場(chǎng),比如新加坡、印度,商湯科技也提前進(jìn)行了布局,擁有較多的專(zhuān)利申請(qǐng)。
圖 11 2020年公開(kāi)的中國(guó)企業(yè)在中國(guó)大陸之外計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名Top10
基礎(chǔ)算法研究格局
計(jì)算機(jī)視覺(jué)的發(fā)展有四大要素:算法、算力、數(shù)據(jù)和場(chǎng)景。萬(wàn)丈高樓平地起,地基是基礎(chǔ)。而基礎(chǔ)算法就是計(jì)算機(jī)視覺(jué)這座高樓的地基。IPC分類(lèi)號(hào)中,G06N對(duì)應(yīng)的分類(lèi)號(hào)包括了目前主流的計(jì)算機(jī)視覺(jué)算法——深度學(xué)習(xí)所涉及的主要技術(shù),即:G06N3/02(采用神經(jīng)網(wǎng)絡(luò)模型),G06N3/04(體系結(jié)構(gòu),例如,互連拓?fù)洌?,G06N3/08(學(xué)習(xí)方法),G06N20/00(機(jī)器學(xué)習(xí))。2020年公開(kāi)的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)中,篩選出G06N下的專(zhuān)利申請(qǐng),得到全球?qū)@暾?qǐng)數(shù)量排名前10的企業(yè)(圖12):除IBM、三星、谷歌、微軟、Intel5家老牌企業(yè)外,其余5家均為中國(guó)企業(yè),騰訊(第2)、百度網(wǎng)訊(第5)、平安科技(第7)、商湯科技(第8)、支付寶(第9)赫然在列,彰顯了中國(guó)計(jì)算機(jī)視覺(jué)算法研究的實(shí)力。與其他業(yè)務(wù)方向廣泛的企業(yè)不同,成立只有6年歷史的商湯科技專(zhuān)注于計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)研究和市場(chǎng)應(yīng)用,在計(jì)算機(jī)視覺(jué)算法研究方面持續(xù)取得不菲成績(jī),其于2014年發(fā)表的DeepID系列人臉識(shí)別算法,在誕生之初就超過(guò)了Facebook同期發(fā)表的Deepface算法, 將人臉識(shí)別準(zhǔn)確度提高到98.52%,在全球首次超過(guò)人眼識(shí)別率,突破工業(yè)化應(yīng)用的紅線(xiàn)。其最新的DeepID-3算法已達(dá)到了99.53%的人臉識(shí)別準(zhǔn)確率。在國(guó)際計(jì)算機(jī)視覺(jué)領(lǐng)域研究的激烈競(jìng)爭(zhēng)中,商湯科技可以與谷歌、微軟等國(guó)際大企業(yè)比肩,為中國(guó)企業(yè)豎起一面旗幟。
圖 12 2020年公開(kāi)的全球深度學(xué)習(xí)算法專(zhuān)利申請(qǐng)排名Top10
總結(jié)
從上世紀(jì)60年代算起,計(jì)算機(jī)視覺(jué)的歷史也不過(guò)半個(gè)多世紀(jì),跟整個(gè)人類(lèi)歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺(jué)已經(jīng)從最開(kāi)始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。
這個(gè)過(guò)程中,隨著時(shí)間的推移,IBM,西門(mén)子,東芝,索尼,佳能,微軟,谷歌,騰訊,OPPO, 商湯科技等企業(yè)的身影依次出現(xiàn)在我們眼前,是他們讓機(jī)器“睜開(kāi)眼睛看見(jiàn)世界”,逐漸地賦予機(jī)器自然視覺(jué)的能力。
2017年,國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確指出新一代人工智能發(fā)展分三步走的戰(zhàn)略目標(biāo),到2030年使中國(guó)人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來(lái)5G帶來(lái)的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺(jué)的發(fā)展和應(yīng)用更是有充滿(mǎn)想象的巨大空間。我們期待在賦予機(jī)器自然視覺(jué)能力的這條路上有更多中國(guó)企業(yè)的身影。
注1:除圖1外,以上各圖的數(shù)據(jù)均來(lái)自智慧芽。
注2:本文關(guān)注的是計(jì)算機(jī)視覺(jué)領(lǐng)域企業(yè)的研究情況,各圖的排名中未考慮高校。
參考資料
[1] 十分鐘讀完人工智能的三生三世
https://baijiahao.baidu.com/s?id=1601076075337670392&wfr=spider&for=pc
[2] 計(jì)算機(jī)視覺(jué)發(fā)展史 https://zhuanlan.zhihu.com/p/142927311
[3] 計(jì)算機(jī)視覺(jué)簡(jiǎn)述
https://blog.csdn.net/lanmengyiyu/article/details/109648345
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:北京專(zhuān)獵前沿技術(shù)有限公司
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
注:原文鏈接:是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述(點(diǎn)擊標(biāo)題查看原文)
如有想看文章主題內(nèi)容,歡迎留言評(píng)論~
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(hù)(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過(guò)億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://jupyterflow.com/
聘!廣東寶樂(lè)機(jī)器人股份有限公司招聘多名「專(zhuān)利工程師」
#晨報(bào)#美國(guó)ITC發(fā)布對(duì)鉆井液振動(dòng)篩網(wǎng)的337部分終裁;英國(guó)知識(shí)產(chǎn)權(quán)局將于2021年4月1日起恢復(fù)官費(fèi)!
文章不錯(cuò),犒勞下辛苦的作者吧