來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
原標題:聽懂你說話才是真的人工智能
前些天,小編接到將十幾個小時的講座錄音轉(zhuǎn)文本的任務,傻敲了半天,才想到是否有專業(yè)軟件能解決問題?果然有,且轉(zhuǎn)換正確率相當高!讓小編狠想扒一扒這產(chǎn)品以及相關的專利技術(shù)。
今年兩會期間,“人工智能”這個詞火了。
因為《政府工作報告》中首次寫入了“人工智能”,這也意味著人工智能(AI)將正式進入國家策略層面。
要想實現(xiàn)AI,首先就需要讓機器能夠與人類進行對話,語音識別便成為AI的熱點技術(shù)。
一、語音識別技術(shù)的進階
今天小編為您介紹的是語音識別技術(shù)的進階——語音轉(zhuǎn)寫技術(shù)。
該技術(shù)將自然語言轉(zhuǎn)換為文本輸出,結(jié)合不同語言之間的轉(zhuǎn)換,實現(xiàn)多語種的文本輸出。
在兩會期間,科大訊飛公司董事長劉慶峰向總理李克強展示了他們公司最新研發(fā)的該人工智能技術(shù)產(chǎn)品。
李克強總理聽取劉慶峰介紹人工智能“曉譯”翻譯機
總理“各位代表:現(xiàn)在,我代表國務院,向大會報告政府工作”的話音剛落,一行通過該技術(shù)將語音實時轉(zhuǎn)換成的字幕,立即就出現(xiàn)在屏幕上。
科大訊飛研發(fā)的語音轉(zhuǎn)寫技術(shù)以及相關的產(chǎn)品專利已經(jīng)獲得授權(quán)(CN 102779508B)。其通過語音提取、語音識別、文本標注三個模塊實現(xiàn)語音到文本轉(zhuǎn)換。
“訊飛聽見”為頒獎典禮提供實時語音轉(zhuǎn)寫
語音識別的難點問題在于講話的人有方言、口音或者自己特殊的表達風格。這類問題如何解決呢?這就需要聽者對說話人的說話風格要有足夠的了解。
(舉個栗子:聽到了聲音“qìng fēng”,說話人想說的是一個名字“慶峰”還是包子鋪“慶豐”?)
看來要讓冷冰冰的計算機了解每個人的風格是一件很復雜的事情。
從訊飛的語音自適應專利技術(shù)(CN 105895104A)來看,其根據(jù)說話人聲音的特征建立模型,基于此模型對說話人的聲音進行識別??磥?,能夠獲得說話人聲音特征的建模方法就是語音識別中的關鍵技術(shù)。
為了能夠準確、快速的掌握說話人的聲音特征,多種性能各異的建模方法被應用于語音識別中,在研發(fā)的過程中,先后出現(xiàn)了DNN(深度神經(jīng)網(wǎng)絡)、CNN(卷積神經(jīng)網(wǎng)絡)、LSTM(時間遞歸神經(jīng)網(wǎng)絡)、Deep CNN(深度卷積神經(jīng)網(wǎng)絡)等性能優(yōu)異的語音模型。
創(chuàng)新實體也在不斷的對語音模型進行改進,以進一步優(yōu)化性能。
語音建模技術(shù)的積累在國內(nèi)也取得了長足的進步,專利申請量逐年遞增,成為了人工智能領域研究的熱點。
在研發(fā)過程中,涌現(xiàn)出了以百度,科大訊飛為代表的國內(nèi)優(yōu)秀企業(yè),技術(shù)上在全球也是處于領先地位。
此外,訊飛產(chǎn)品還能夠自動生成一段語音精華,其中使用了語音摘要技術(shù)(CN 106446109A)。有了這個技術(shù),機器人不但能夠聽懂你,而且能夠幫你歸納總結(jié)。
是不是感覺機器已經(jīng)具備思考的基礎了?
訊飛錄音筆實時轉(zhuǎn)文字
最炸裂的是:它還可以自己做摘要
人工智能是對人的意識、思維的信息過程的模擬,其出現(xiàn)就是為了代替人類完成某些繁重的工作。
二、它的發(fā)展代表了未來?
原來從1999年成立的科大訊飛,早就陪伴在你身邊。
“對不起,您撥打的電話正在通話中,請稍后再撥!sorry, the telephone you dialed is busy now, please redial later. ”這句經(jīng)?;厥幵诙叺脑?,竟然出自訊飛之手。
你撥打各大運營商、銀行等電話時的自助語音客服,背后是來自科大訊飛的技術(shù)。
每天使用的微信、高德地圖(例如林志玲和郭德綱的合成音)、滴滴出行、攜程、大眾點評、新浪微博等在內(nèi)的20余萬+合作伙伴使用的語音技術(shù)來自訊飛。訊飛通過這些終端覆蓋超過9億的用戶,每天在線服務量達20億次。
教育方面,每年的國家普通話評測、中高考的口語評測,機器評測技術(shù)都是來自科大訊飛。2015年科大訊飛機器智能閱卷技術(shù)便已在安慶、合肥等地成功試點應用。
經(jīng)過對人機評分結(jié)果的分析,指標方面都已達到或超過人工評分水平。這意味著,讓機器評閱主觀題已不再是空想。其中最讓人眼前一亮的,是哈工大訊飛聯(lián)合實驗室研發(fā)的語文作文評分技術(shù)。
機器人方面,讓機器人參加高考,并考上重點大學,這是“訊飛超腦”計劃的目標之一。
“高考機器人項目”始于2015年7月,起源于科大訊飛(002230)牽頭承辦了國家“十二五”863計劃信息技術(shù)領域“基于大數(shù)據(jù)的類人智能關鍵技術(shù)與系統(tǒng)”項目。
只有能夠跟人交流,懂人類語言的機器人,才是最NB的機器人。據(jù)悉,訊飛正在探索讓機器自動學習,能夠讓機器理解自然語言,同時將自然語言與我們?nèi)祟惖母拍钸B接在一起。
習大大在2016年4月參觀訊飛的機器人“曉曼”,并進行了親切的交談。
在汽車領域,訊飛開發(fā)了“飛魚助理”,它承擔了一個車載秘書的功能。使用的越多,它對用戶的個人喜好越了解,對答的時候便能提供更準確的服務。
專業(yè)領域和個性化方面
科大訊飛與北京協(xié)和醫(yī)學院簽署全面戰(zhàn)略合作框架協(xié)議,推出智慧醫(yī)療系統(tǒng),智能語音是其中一項重要技術(shù)。通過采集醫(yī)生的語音信息并實時轉(zhuǎn)換成文字來記錄病例和布置醫(yī)囑,節(jié)省了醫(yī)生手寫病例的時間,提高了醫(yī)生的工作效率。
科大訊飛還與最高人民法院信息技術(shù)服務中心簽訂戰(zhàn)略合作協(xié)議,將智能語音識別系統(tǒng)應用于庭審文字記錄的生成中,共同致力于打造“智慧法院”。
還有娛樂方面,訊飛還將語音合成產(chǎn)品進行了個性化應用。如通過語音合成模擬奧巴馬等名人的音色,可以模仿奧巴馬發(fā)出聲音,讓你分分鐘變身名人。
不清楚各行各業(yè)的人工智能化是否會讓人失業(yè),但也許這就是未來,讓人類從重復勞動中抽身去發(fā)揮創(chuàng)意特長。
有了這樣的智能語音技術(shù),或許在以后的現(xiàn)實生活中,我們也能夠與擎天柱做朋友,有大白溫馨的陪伴,體驗人工智能伴隨我們的人類世界。
來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
編輯:IPRdaily.cn 趙珍
校對:IPRdaily.cn 縱橫君
推薦閱讀
點擊下方圖片即可閱讀
「智戰(zhàn)2017」首屆知識產(chǎn)權(quán)競爭策略挑戰(zhàn)賽,等你來戰(zhàn)!要你好看!
首席知識產(chǎn)權(quán)官:一個即將崛起的知識產(chǎn)權(quán)職業(yè)群體!
十七種知識產(chǎn)權(quán)商業(yè)模式!
「關于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務平臺,致力于連接全球知識產(chǎn)權(quán)人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務、政府機構(gòu)、律所、事務所、科研院校等全球近50多萬產(chǎn)業(yè)用戶(國內(nèi)25萬+海外30萬);同時擁有近百萬條高質(zhì)量的技術(shù)資源+專利資源,通過媒體構(gòu)建全球知識產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://jupyterflow.com/”
文章不錯,犒勞下辛苦的作者吧