#本文僅代表作者觀點(diǎn),不代表IPRdaily立場#
原標(biāo)題:谷歌黑科技:用人工智能,把搜索變成對(duì)話
6月16日舉辦的的I/O大會(huì)上,谷歌展示了LaMDA,一款“可以就任何話題展開對(duì)話”的人工智能。谷歌CEO Sundar Pichai表示,LaMDA 的自然對(duì)話功能有可能徹底改變信息和計(jì)算,讓它們變得更易于訪問和使用。未來的搜索也許就會(huì)像跟專家對(duì)話一樣,通過一段段的對(duì)話,慢慢把你想要的答案呈現(xiàn)出來。
重點(diǎn):
谷歌最近推出了LaMDA,一款 “可以就任何話題展開對(duì)話”的人工智能
谷歌對(duì)搜索未來的將以人工智能為中心
這種AI可以推斷人類語言的含義,參與對(duì)話,并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題
谷歌還推出了另一款人工智能工具,也就是所謂的多任務(wù)統(tǒng)一模型(MUM),讓用戶結(jié)合文字和圖像進(jìn)行查詢
使用大型語言模型的搜索引擎可提出建議、檢索文檔、回答問題并完成廣泛的任務(wù),但依然存在偏見的風(fēng)險(xiǎn)
谷歌經(jīng)常會(huì)利用自己一年一度舉辦的開發(fā)者大會(huì) I/O 來展示其令人驚嘆的人工智能。2016 年,它推出了帶內(nèi)置Google Assistant 的 Google Home 智能音箱。2018 年,為企業(yè)接聽電話和安排約會(huì)的Duplex 首次亮相。按照這一傳統(tǒng),上個(gè)月,首席執(zhí)行官Sundar Pichai宣布推出了LaMDA ,一款 “可以就任何話題展開對(duì)話”的人工智能。
在臺(tái)上的演示中,Pichai展示了跟紙飛機(jī)以及天體冥王星交流是什么感覺。對(duì)于每一個(gè)查詢,LaMDA 都會(huì)用三到四個(gè)句子來予以回應(yīng),就好像兩個(gè)人之間進(jìn)行的自然對(duì)話一樣。Pichai說,慢慢地,LAMDA將會(huì)融入到谷歌的其他產(chǎn)品之中,比如Assistant和Workspace,以及最關(guān)鍵的搜索。
Pichai說:“我們相信LaMDA 的自然對(duì)話功能有可能徹底改變信息和計(jì)算,讓它們變得更易于訪問和使用。”
這次LAMDA的演示為我們提供一個(gè)窗口,讓我們得以一窺谷歌對(duì)搜索的愿景,這個(gè)愿景已經(jīng)超越了鏈接列表,并可能改變數(shù)十億人對(duì)web的搜索方式。這個(gè)愿景將以人工智能為中心,它可以推斷人類語言的含義,參與對(duì)話,并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題。
同樣也是在6月16日舉辦的I/O 大會(huì)上,谷歌還推出了另一款人工智能工具,也就是所謂的多任務(wù)統(tǒng)一模型 (Multitask Unified Model ,MUM),它可以在搜索的時(shí)候把文本和圖像考慮在內(nèi)。谷歌副總裁Prabhakar Raghavan說,有朝一日用戶可以拍下一雙鞋的照片,然后到搜索引擎詢問這雙鞋是否適合攀登富士山的時(shí)候穿。
MUM 可以生成 75 種語言的結(jié)果,谷歌聲稱這可以讓它對(duì)世界的了解更加全面。臺(tái)上的演示展示了 MUM 是怎么響應(yīng)搜索查詢的,當(dāng)用戶輸入“我已經(jīng)爬過亞當(dāng)斯山了,現(xiàn)在我想明年秋天爬富士山,我該怎么做?” 這個(gè)搜索查詢跟我們今天在谷歌上進(jìn)行的搜索在表述上有所不同,因?yàn)?MUM的目標(biāo)是減少查找到答案所需的搜索次數(shù)。MUM 既可以對(duì)文本進(jìn)行概括也可以生成文本;它會(huì)知道拿亞當(dāng)斯山與富士山進(jìn)行比較,并且知道為遠(yuǎn)足做準(zhǔn)備可能需要有關(guān)健身訓(xùn)練、遠(yuǎn)足裝備推薦以及天氣預(yù)報(bào)方面的搜索結(jié)果。
在上個(gè)月發(fā)表的一篇題為“重新思考搜索:從業(yè)余愛好者變成專家”的論文中,谷歌研究院的四位工程師把搜索設(shè)想成跟人類專家的對(duì)話。論文提到了一個(gè)例子,搜索“紅葡萄酒的健康益處和風(fēng)險(xiǎn)是什么?”目前,谷歌會(huì)回復(fù)一個(gè)要點(diǎn)列表。而這篇論文表明,未來搜索引擎的回應(yīng)可能看起來更像是一段話,里面會(huì)說紅酒可促進(jìn)心血管健康,但可能會(huì)弄臟你的牙齒,并且會(huì)補(bǔ)充相關(guān)的信息來源與鏈接。論文顯示,回復(fù)是文本形式,但你很容易會(huì)想到口頭回復(fù)的可能性,就像今天我們使用 Google Assistant 的體驗(yàn)一樣。
不過更多地依賴人工智能來破譯文本也存在風(fēng)險(xiǎn),因?yàn)橛?jì)算機(jī)依然難以理解語言的各種微妙復(fù)雜之處。用來完成生成文本或回答問題等任務(wù)的最先進(jìn)的人工智能,也就是所謂的大型語言模型,已經(jīng)顯示出存在放大偏見,以及生成不可預(yù)測或有害文本的傾向。其中有一個(gè)模型,也就是OpenAI 的GPT-3,已被用于為動(dòng)畫角色創(chuàng)建互動(dòng)故事,但在一個(gè)在線游戲里面它也生成過牽涉到兒童性愛場景的文字。
作為去年發(fā)表并進(jìn)行展示的一篇論文的一部分,來自麻省理工學(xué)院、英特爾和以及Facebook 的研究人員發(fā)現(xiàn),大型語言模型表現(xiàn)出基于對(duì)種族、性別、宗教和職業(yè)所存在的刻板印象的偏見。
擁有自然語言處理倫理學(xué)博士學(xué)位的語言學(xué)家Rachael Tatman表示,隨著這些模型生成的文本變得越來越有說服力,它可以讓大家相信自己正在跟能夠理解自己所表達(dá)單詞含義的人工智能交談。但生成——其實(shí)對(duì)世界并沒有常識(shí)性的理解。當(dāng)它生成對(duì)殘疾人或穆斯林有害的文本或者告訴大家去自殺時(shí),這可能就會(huì)造成問題。Tatman回憶起一位圖書管理員曾經(jīng)教過自己怎么去判斷 Google 的搜索結(jié)果是否有效。她說,如果谷歌把大型語言模型跟搜索結(jié)合起來的話,用戶就得被迫學(xué)會(huì)怎么評(píng)估跟專家 AI 的對(duì)話。
Google 是一家建立在 PageRank 之上的公司。PageRank 是公司聯(lián)合創(chuàng)始人 Larry Page 和 Sergey Brin在 1990 年代后期研究式創(chuàng)建出來的一種算法。這種算法要依賴于索引——這是一個(gè)利用算法對(duì)網(wǎng)站進(jìn)行排序和評(píng)估的過程。后來慢慢地,谷歌又把知識(shí)圖譜,一個(gè)龐大的事實(shí)庫,納入到搜索結(jié)果里面。
最近,谷歌開始把語言模型納入到搜索響應(yīng)里面。2019 年,該公司把一種叫做 BERT 的模型植入到搜索里面,以便回答對(duì)話式搜索查詢、建議搜索,并對(duì)出現(xiàn)在搜索結(jié)果下方的文本進(jìn)行摘要。當(dāng)時(shí),谷歌副總裁Pandu Nayak稱這是五年來搜索領(lǐng)域取得的最大進(jìn)步,也是“搜索史上最大的飛躍之一”。微軟的 Bing在提供搜索結(jié)果時(shí)也用到了BERT。
BERT 在 2018 年的引入在科技巨頭之間開啟了一場競賽,大家都在競相創(chuàng)建出規(guī)模更大的語言模型,力爭在語言理解或回答問題等任務(wù)上在 GLUE 等流行的性能排行榜上能取得更高的排名。不久之后,百度推出了Ernie,Nvidia推出了Megatron,微軟推出了 T-NLG,OpenAI 推出了 GPT-3。工程師通常會(huì)通過參數(shù)的數(shù)量,也就是深度學(xué)習(xí)系統(tǒng)中人工神經(jīng)元之間連接的度量來評(píng)估這些模型。BERT 包含了數(shù)億個(gè)參數(shù),GPT-3 的參數(shù)則高達(dá)1750 億個(gè)。今年1 月,谷歌發(fā)布了一個(gè)帶有 1 萬億參數(shù)的語言模型。在 Google 今年的 I/O 活動(dòng)上,Raghavan稱在參數(shù)的數(shù)量上 MUM 比 BERT 強(qiáng)大 1000 倍。
在《重新思考搜索》那篇論文中,谷歌研究人員稱索引是現(xiàn)代搜索的馱馬。但是他們?cè)O(shè)想今后通過利用能理解更多查詢的,更龐大的語言模型來消除索引。
比方說,知識(shí)圖譜可以針對(duì)對(duì)事實(shí)問題提供答案,但那只針對(duì)web的一小部分進(jìn)行了訓(xùn)練。使用基于更廣泛的web構(gòu)建的語言模型,將可以讓搜索引擎提出建議、檢索文檔、回答問題并完成廣泛的任務(wù)。《重新思考搜索》那篇論文的作者表示,這種方法有可能帶來“思維的變革性轉(zhuǎn)變”。
這樣的模型并不存在。事實(shí)上,作者說這可能需要?jiǎng)?chuàng)建出通用人工智能,或在信息檢索和機(jī)器學(xué)習(xí)等領(lǐng)域取得進(jìn)步。此外,他們希望這種新方法能夠從多個(gè)角度提供權(quán)威答案,清晰地披露來源,并且不帶偏見。
谷歌發(fā)言人把LaMDA和 MUM說成是谷歌下一代語言模型研究的一部分,并且表示, MUM 目前正在內(nèi)部開展試點(diǎn),來幫助大家查詢數(shù)十億個(gè)主題。在被問及《重新思考搜索》那篇論文跟LaMDA和 MUM 的關(guān)系時(shí),這位發(fā)言人表示,Google Research并沒有給谷歌產(chǎn)品設(shè)定方向,進(jìn)入谷歌產(chǎn)品(如搜索)的機(jī)器學(xué)習(xí)通常是作為補(bǔ)充而不是取代現(xiàn)有產(chǎn)品。
他們的野心比展示廣告領(lǐng)域要大多了。
Michael Blumenthal,搜索顧問
不可避免地,谷歌搜索算法的任何變化都會(huì)影響到核心的廣告業(yè)務(wù)。這一該業(yè)務(wù)去年為谷歌創(chuàng)造了 1470 億美元的收入。搜索顧問Michael Blumenthal表示,關(guān)于登山靴的 MUM 演示表明,谷歌希望在連接企業(yè)與消費(fèi)者之間發(fā)揮更大的作用。上個(gè)月的另一個(gè)變化是,谷歌引入了跟Shopify的集成,將 170 萬商家的商品帶到搜索結(jié)果里面。2019年,外賣公司DoorDash和Postmates已經(jīng)進(jìn)入到搜索結(jié)果里面。
20 年來一直為企業(yè)提供搜索策略咨詢服務(wù)的 Blumenthal 指出,谷歌搜索結(jié)果已經(jīng)從由 PageRank 提供的鏈接列表,演變?yōu)榘褟V告、知識(shí)面板、地圖、視頻和增強(qiáng)現(xiàn)實(shí)納入在內(nèi)。
這種轉(zhuǎn)變導(dǎo)致了部分人所謂的零點(diǎn)擊搜索(zero-click)的興起。零點(diǎn)擊搜索,是指大家將不再靠點(diǎn)擊進(jìn)入網(wǎng)站來完成一次web搜索。這讓 Google 能夠在不需要用戶離開谷歌渠道別的地方的情況下獲得廣告收入。數(shù)字?jǐn)?shù)據(jù)公司Similarweb估計(jì),去年在近三分之二的谷歌搜索當(dāng)中用戶都沒有點(diǎn)擊進(jìn)入到另一個(gè)頁面;在移動(dòng)設(shè)備上,點(diǎn)擊率(click-through rates)尤其低。
Blumenthal在談到谷歌正在考慮進(jìn)行的搜索變革時(shí)說:“在我看來,他們的野心要比展示廣告領(lǐng)域大多了。他們喜歡將各方連接起來進(jìn)行交易,所以我把這看作是極大地增強(qiáng)了這一點(diǎn)?!?br/>
強(qiáng)調(diào)用自然語言或圖像進(jìn)行搜索的變化可能會(huì)讓用戶不再把注意力放在關(guān)鍵字上,而且還會(huì)破壞價(jià)值數(shù)十億美元的搜索引擎優(yōu)化業(yè)務(wù)——目前企業(yè)仍爭相靠這一業(yè)務(wù)讓自己靠近搜索結(jié)果的頂部。
部分搜索引擎優(yōu)化公司一直在為自然語言的未來做著準(zhǔn)備。Copysmith.ai 是一家總部位于美國阿拉巴馬州伯明翰的初創(chuàng)企業(yè),它利用了 GPT-3來為網(wǎng)站生成 SEO元標(biāo)簽等。公司的首席執(zhí)行官Shegun Otulana表示,該公司不認(rèn)為谷歌最近的舉動(dòng)“是一種威脅,而是整個(gè)人工智能領(lǐng)域往前又邁進(jìn)了一步。這證實(shí)了我們正在朝著正確的方向前進(jìn)?!?/p>
Blumenthal則表示,I/O上面發(fā)布的引人注目的公告可能需要數(shù)年的時(shí)間才能兌現(xiàn)承諾,但他同時(shí)表示,有一點(diǎn)越來越清楚,谷歌想要的不僅僅是事實(shí)和鏈接的集合,而是希望自己更像一位能夠回答復(fù)雜問題的專家?!拔ㄒ坏膯栴}是他們什么時(shí)候能到達(dá)那里,”他說。
谷歌把大型語言模型作為商業(yè)戰(zhàn)略和研究重點(diǎn)的做法在公司內(nèi)部造成了沖突。最值得注意的一點(diǎn)是,谷歌 Ethical AI 團(tuán)隊(duì)的兩位前領(lǐng)導(dǎo),Timnit Gebru和 Margaret Mitchell,他們?cè)诠餐珜懥艘黄獜?qiáng)調(diào)對(duì)此類模型的擔(dān)憂的論文之后就被迫離職了。除此之外,這篇論文引用的研究表明,大型語言模型會(huì)延續(xù)人類的偏見和刻板印象,并可能導(dǎo)致氣候變化。該論文稱,隨著語言模型變得越來越龐大,糟糕的數(shù)據(jù)標(biāo)記和管理實(shí)踐會(huì)變成更大的問題。至關(guān)重要的是,論文還指出,大型語言模型對(duì)社會(huì)造成的危險(xiǎn)最有可能落在被邊緣化的社區(qū)身上。
今年 1 月,近期另一篇批評(píng)大型語言模型的人工智能研究論文的作者,說谷歌法律和政策團(tuán)隊(duì)的干預(yù)“非常陰險(xiǎn)”。今年 3 月,來自谷歌DeepMind 的研究人員發(fā)現(xiàn),大型語言模型可以通過傳播刻板印象、失業(yè)和虛假信息,在創(chuàng)作者沒有任何惡意的情況下給社會(huì)造成危害。
來源:36氪
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
青年有為!尋找2021年“40位40歲以下企業(yè)知識(shí)產(chǎn)權(quán)精英”活動(dòng)正式啟動(dòng)
報(bào)名!2021年「廣東省知識(shí)產(chǎn)權(quán)代理人才培訓(xùn)班」來啦!
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自36氪并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請(qǐng)注明出處:“http://jupyterflow.com/
Amazon One手掌支付系統(tǒng) 現(xiàn)已在紐約上市
文旅新生態(tài)!探索科技與藝術(shù)相融之美——國內(nèi)首部派對(duì)式戲劇《幻境2099》強(qiáng)勢來襲
文章不錯(cuò),犒勞下辛苦的作者吧