AI語音解放雙手,解放思維
相比AI的其他領(lǐng)域,語言智能產(chǎn)業(yè)與產(chǎn)品的應(yīng)用行業(yè)更顯親近和自然。手機、智能家居、育兒機器人等設(shè)備都離不開語音語言的交互應(yīng)用,隨著科技巨頭們的資本涌入,語言智能成為爭奪未來智能家居和高端信息服務(wù)市場的入口。
在分析領(lǐng)域,機器通過對人類語言文本的學(xué)習(xí)、理解獲取世界知識和常識,進而幫助人類完成復(fù)雜問題的求解和分析預(yù)測,提供更加人性化的知識服務(wù),已是可以預(yù)期的未來。而就傳統(tǒng)行業(yè)而言,語音技術(shù)的滲入對于普通大眾來說是一件好事,它將給我們的生活帶來實質(zhì)性的改變。
智能音箱:物聯(lián)網(wǎng)新入口
說到AI語音識別和交互,你現(xiàn)在還只想到語音輸入法或者Siri這樣存在于手機里的App,那就太跟不上時代了。連蘋果自己在不久前的WWDC大會上也發(fā)布了Siri的實體化產(chǎn)品Homepod,這正是一款智能音箱產(chǎn)品。
問題來了:音箱能有多智能?實際上,智能音箱只是它外觀的直觀描述,它真正扮演的是智能家居的樞紐角色,是一個智能機器人管家。想象一下,有了智能音箱(假設(shè)它名字叫小英),以后你早上睜開眼睛的第一件事不是去拿手機看時間,而是隨意對著空氣喊一聲:小英,幾點了?從擺在桌角的智能音箱里馬上傳來自然的人聲,告訴你現(xiàn)在的時間,并且問你現(xiàn)在要起床嗎?得到肯定的答復(fù)后,小英自動打開了電動窗簾,讓陽光照進房間,緊接著問了一句:需要點音樂或者聽段新聞幫助清醒嗎?你直接說出想聽的音樂、新聞的名稱或者關(guān)鍵詞,很快音箱里就響起了你要聽的東西。穿衣服的時間里,你想起有封郵件不知昨晚深夜是否已收到,工業(yè)機器人維修,小英,給我查一下郵件。一會兒,新郵件的標題就被讀了出來
當然,這是一個理想的場景,但目前AI語音識別和交互技術(shù)的現(xiàn)實水平,離這也并不遙遠了。國內(nèi)外的智能音箱產(chǎn)品都已經(jīng)做到在一個普通房間大小的空間范圍內(nèi),靈敏地識別人聲;并且在有一定的環(huán)境噪音存在時,語音的識別和交互也不會受到顯著影響。
相對于與手機做語音交互而言,智能音箱的進步就是解放了人的雙手,讓人機交互更加自然。正如阿里人工智能實驗室負責(zé)人陳麗娟所說:語言是人與人之間最主要的溝通方式,也應(yīng)該是人與另外一種智能進行交流的主要方式。
因為具備語音交互能力的智能音箱有成為智能家居控制中心的能力,近兩年國內(nèi)外科技巨頭紛紛推出自己的智能音箱產(chǎn)品,搶占物聯(lián)網(wǎng)的重要入口。2014年11月,亞馬遜先人一步推出智能音箱Echo占領(lǐng)市場;2016年5月,谷歌的GoogleHome亮相;微軟等企業(yè)也不甘寂寞。進入2017年,中國的BAT也在加緊追趕,7月初,百度宣布收購美國語音交互技術(shù)公司KITT.AI;同一天阿里發(fā)布智能音箱天貓精靈X1;此前的6月底,騰訊發(fā)布了智能語音解決方案小微;更早的2015年,京東聯(lián)合科大訊飛推出了叮咚音箱。
目前亞馬遜仍以絕對優(yōu)勢領(lǐng)跑家用智能音箱市場,在全球家用智能音箱市場份額占比超過40%。但亞馬遜在這個領(lǐng)域的成功遠非率先推出幾款硬件產(chǎn)品那么簡單。實際上,在2014年推出Echo后不久,亞馬遜就宣布將Alexa語音平臺開放給第三方,不但包括智能家居軟件開發(fā)人員,還包括智能家居硬件制造商。開放平臺的策略給Alexa帶來巨大的發(fā)展空間。據(jù)亞馬遜公開的數(shù)據(jù),Alexa在2014年最初發(fā)布時只有13個內(nèi)嵌的技能,而目前兼容的應(yīng)用已經(jīng)超過1.5萬個,它已成為諸多智能硬件產(chǎn)品的標配:華為的智能手機、LG的家庭機器人、惠而浦的洗衣機、福特的汽車等,都搭載了Alexa平臺。Alexa成為了基于語音媒介的全新操作系統(tǒng),這是其智能音箱產(chǎn)品可以成為智能家居中心的關(guān)鍵。
伴隨著智能家居市場的高速擴張,智能語音行業(yè)有望迎來爆發(fā)式增長。市場研究公司Tractica估計,到2021年將有4000萬家庭使用基于語音的數(shù)字助手。調(diào)研機構(gòu)StrategyAnalytics指出,2016年全球智能音箱出貨量為590萬臺,預(yù)計到2022年將增長10倍,市場規(guī)模達到55億美元。
盡管目前來看,庫卡機器人何服電機維修,各大開發(fā)商還無法通過智能語音應(yīng)用程序直接獲利,但從亞馬遜公布的數(shù)據(jù)來看,智能音箱產(chǎn)品有助于引導(dǎo)用戶消費需求,從而實現(xiàn)更多增值收入。
AI語音助力智能醫(yī)療
在醫(yī)院里,一位醫(yī)生一邊看X光片,一邊對著手里的麥克風(fēng)說:核對患者及手術(shù)標記無誤,麻醉成功后,清潔手術(shù)區(qū)域皮膚,給予靜脈預(yù)防抗生素語音實時轉(zhuǎn)化成文字,自動輸入進電腦里,記錄在了患者的電子病歷上,而且基本沒有錯別字,不需要修改。
這是現(xiàn)實的場景。它發(fā)生在北京協(xié)和醫(yī)院,智能語音病歷錄入系統(tǒng)的應(yīng)用,讓平均每個醫(yī)生每天整理病例的時間從超過3小時,降低到了1小時。
開發(fā)該醫(yī)院語音技術(shù)的企業(yè)是云知聲。當年進入這個領(lǐng)域時,Siri等各種語音助手很火,但該企業(yè)的負責(zé)人認為,這類語音助手注定是個偽命題,一定不會成功。在他們看來,AI并不是一個產(chǎn)品,而是一個賦能技術(shù),是萬金油,比如人臉識別和安防結(jié)合才是產(chǎn)品,如果AI沒有應(yīng)用場景,用戶是無感的。我們需要做的,是切入這一領(lǐng)域時,將語音助手和場景結(jié)合,使得它可以服務(wù)于各行各業(yè)。
在他們看來,醫(yī)療領(lǐng)域同樣如此。2013年,醫(yī)院信息化還是只有WIFI,那時候談AI根本不可能。但今天,隨著深度學(xué)習(xí)、大數(shù)據(jù)的積累,語音識別的準確率能做到97%-98%,即便是比較嘈雜的環(huán)境,也可以做到90%以上的識別,這樣AI與醫(yī)院信息化的結(jié)合,有了一個新的機會。
根據(jù)國家衛(wèi)計委規(guī)劃信息司透露,醫(yī)療衛(wèi)生信息化是國家信息化發(fā)展的重點,已納入十三五國家網(wǎng)絡(luò)安全和信息化建設(shè)重點,將實現(xiàn)集中突破。權(quán)威機構(gòu)預(yù)測,未來幾年,我國醫(yī)療信息化規(guī)模將持續(xù)增長,國內(nèi)目前三級醫(yī)院1400家,二級醫(yī)院8000家,一級醫(yī)院接近1.4萬家;在理想狀態(tài)下的10年后,三級醫(yī)院每年至少拿出收入的3%用于信息化建設(shè),二級和一級醫(yī)院拿出1.5%進行信息化建設(shè),屆時醫(yī)療信息化的市場規(guī)模將超過800億元。
有應(yīng)用場景,也有市場需求,這就可以理解為何許多AI公司都在布局醫(yī)療行業(yè)的語音技術(shù)。其中包括國內(nèi)該領(lǐng)域的領(lǐng)頭羊科大訊飛。
其實科大訊飛很早之前就已開始試水醫(yī)療,2014年8月,他們針對語音技術(shù)在醫(yī)療方面的應(yīng)用開展了研究,并在部分醫(yī)院進行了試點,其產(chǎn)品是把語音記錄自動轉(zhuǎn)換為文字,生成電子病歷,但一直未大規(guī)模使用。
2015年,科大訊飛開展三大醫(yī)療業(yè)務(wù)戰(zhàn)略,其中就包括語音醫(yī)療解決方案。在這部分產(chǎn)品線上,科大訊飛的初衷是通過智能語音交互技術(shù)對醫(yī)院臨床業(yè)務(wù)進行流程再造,減輕醫(yī)生的文書壓力,提高醫(yī)生工作效率。
2016年,科大訊飛智慧醫(yī)療業(yè)務(wù)的云醫(yī)聲手機應(yīng)用在安徽省立醫(yī)院正式投入使用。云醫(yī)聲不僅能夠收集病人的資料,方便醫(yī)生隨時查閱,還能將醫(yī)生說用自然語言說出的醫(yī)囑直接記錄整理成電子文檔,同時還可給醫(yī)生精準推送醫(yī)療文獻等數(shù)據(jù)。




