生物技術下一個高點語音識別 搭智能之風崛起
2015年01月19日 13:31:34來源:中國安防展覽網點擊量:46124
導讀中國生物特征識別市場規模保持高速增長,近幾年中國將在信息技術、信息安全、金融交易、社會安全等領域推動生物特征識別標準化工作,產業潛力很大。自2002-2012年,中國生物識別行業的市場平均增長率都在60%以上,2012年市場規模達到60多億人民幣,而預計到2015年,中國生物識別行業的市場規模將可能達到100億以上。
【中安防展覽網 焦點新聞】中國生物特征識別市場規模保持高速增長,近幾年中國將在信息技術、信息安全、金融交易、社會安全等領域推動生物特征識別標準化工作,產業潛力很大。自2002-2012年,中國生物識別行業的市場平均增長率都在60%以上,2012年市場規模達到60多億人民幣,而預計到2015年,中國生物識別行業的市場規模將可能達到100億以上。
據前瞻產業研究院數據顯示,指紋識別占生物識別技術的份額高,但整體呈下降趨勢,從2007年的66.9%降至2013年的60.1%,預計到2020年將下降至52%左右;而語音識別、人臉識別、虹膜識別則增長迅速,2020年比重預計分別達22.4%、9.6%、6.4%。從這組數據看,語音識別將是繼指紋識別后的另一種被廣泛應用生物識別方式。
在智能家居中,智能語音控制逐漸成為產業剛需。來自2014中國語音產業發展白皮書中的數據顯示,2014年,智能語音產業規模已突破47.5億美元,較2012年的24.4億美元增長的近一倍。
關于語音識別
語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。也被稱為自動語音識別(ASR),其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發出語音的說話人而非其中所包含的詞匯內容。
語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。
語音識別交互的進化歷程
回顧人類發展歷史,不難看出,隨著人類不斷進化,從初通過手掌、肢體使用簡單工具、傳遞簡單信息,發展到控制發聲并通過耳朵接收,形成了一個以語音為載體的快速信息傳遞通道和收發閉環,成為人類間自然、重要的信息交互手段。聲波作為一種音頻信號,和視頻信號、無線電信號一樣是,非接觸方式傳播,也是人類可以不借助工具就可自由掌控的一種天然“無線”資源。
而且聲波對接收指向性的要求更寬松,這個非常寶貴的特性會在很多場景下帶來極大便利。特別是對于一些在視覺、觸覺等方面存在障礙(如老年人、弱視、殘障人士)或不適合(如兒童需要保護視力)的龐大特定人群,語音更是佳的交互選擇。
而作為這種功能在移動端延伸,手機相關的語音交互功能早要追溯到十幾年前的功能機時代。它初是以語音撥號的形式來實現這種交互,當時以摩托羅拉、諾基亞為首的一批國外手機廠商,通過預先錄制預存用戶的語音樣本,然后使用時由用戶進行語音口述,比對預留樣本,從而實現語音撥號的功能。
這項功能后續進行了進一步的發展,例如摩托羅拉在其A系列上從語音撥號進化到語音控制層面,就是通過語音能控制手機發短信、打開應用程序諸如音樂等。但是,這一階段的語音交互技術有個致命的問題,就是準確性不高。因為它采用的是通過預存樣本比對的技術來實現,這樣的技術受限度很大,主要有以下三個:
A、受外界背景噪音干擾:因為是采用的樣本音頻分析對比,所以對來源音頻的質量要求較高,如果來源音頻背景噪音太嚴重,會造成與預留樣本不符而比對失敗。想想,你在一個安靜的環境里錄完音,然后在大街上去使用,這種成功率會高嗎?
B、使用者發音前后不一干擾:
同樣的道理,你預留的樣本音頻是健康時的,而使用時因為風寒感冒了,很可能會造成比對失敗,這樣也會影響成功率。
C、其它使用者無法使用:你的樣本是你自己的,如果換成你的愛人,或者小孩,按照這種樣本對比,就根本無法使用了。
以上這些因素,造成之前的手機語音功能識別率太低,如同雞肋,所以也沒有在手機中起到決定性的作用。
語音識別應用設備興起
今年,智能設備的興起給語音識別帶來新生,語音識別技術的進步也讓語音識別的應用開始拓展開來。目前,語音識別技術在通信領域已得到廣泛的應用,包括AT&T、Verizon、LG電子、諾基亞、摩托羅拉,在終端上都載入了語音識別的技術。另外,在航空領域,美國航空公司也使用了語音識別系統。
在智能交通車聯網的影響下,語音識別在智能駕駛中被應用起來:自主式導航語音應用、Telematics系統語音應用、LBS系統語音應用就是三個典型的應用。
自主式導航語音應用
傳統的車載導航產品,是用眼睛看的方式獲取相關信息,對汽車駕駛者而言存在一定的安全隱患。而車載語音導航系統則從根本上變革了信息獲取方式,變看為聽,并以語音命令的方式進行設備操控,使車載導航更具人性化,使駕駛者出行更安全、便捷。
Telematics系統語音應用
基于智能語音合成技術,通過Telematics提供的服務,可以為用戶語音播報天氣情況、交通地圖、實時路況信息,甚至是動態新聞、E-mail、小說及自主選擇的各種文字信息。基于智能語音識別技術,用戶可以對Telematics提供的服務進行語音命令操作與語音信息查詢,在駕駛或緊急情況下,省去了層層菜單操作帶來的麻煩,也避免了手動操作帶來的安全隱患。
LBS系統語音應用
基于智能語音技術的LBS系統(定位服務又叫做移動位置服務Location Based Service,Lbs),用戶通過語音就可以便捷的找到想要的定點信息,如附近餐館、咖啡廳、停車場、商貿中心或旅游景點等,系統借助語音識別技術識別用戶的需求,并按照距離用戶當前位置的遠近,搜索到滿足要求的定點信息詳細情況,并通過語音合成系統將相關信息播報給用戶。
在智能家居,語音智能燈讓家居生活實現了智能化。“Voccas witch light”是一款能將通知設備用戶準備發出語音命令,之后用戶就可以通過語音命令開啟或關閉的燈泡。Vocca Pro通過藍牙連接手機,隨意開關燈,任何英語單詞都可以,比如帶著妹子踱步屋內,你可以伸出雙手舉向天空,緩緩地(聲音要略大)說出“Let the rebe light”(要有光)燈立即隨聲點亮!
搭載智能穿戴設備,語音識別市場競爭情況分析
其實,智能語音識別早已不是新鮮事,蘋果的Siri已為大家所熟知,谷歌的GoogleNow也名聲在外。而智能可穿戴設備問世后,將智能語音識別服務推向一個新的。智能手環、手表、眼鏡等受限于本身的功能化設計,缺少甚至沒有屏幕、鍵盤等輸入輸出裝置,無法實現充分的人機交互,曾經被視為雞肋的智能語音識別,迎來了用武之地。
“2015年國內智能手表市場將快速發展。Apple Watch產能預計是3000萬臺,國內可能有2百萬至3百萬臺。對應的基于Android的智能手表也會有2百萬至3百萬臺的銷量,我們很看好未來智能手表市場。”李志飛表示。
除了可穿戴設備領域,智能語音識別在汽車領域亦可能得到廣泛應用。由于人們對行車安全問題越來越重視,未來智能語音助手的應用幾率更高。蘋果公司已經聯合法拉利、奔馳及沃爾沃等汽車廠商,合作推出了CarPlay車載系統,而Google也即將發布車載平臺Android Auto。此外,在智能家居領域,結合出色的語音識別技術,正處于發力階段的智能家居平臺也將有更多期許。
不過,也有人對可穿戴市場表示了擔憂。投資公司Piper Jaffray新的消費者調查數據顯示,目前有7%的iPhone用戶有意購買蘋果的Apple Watch,與2014年9月份的調查結果相比,下滑了1%。三星的Galaxy Gear發布前得到了Apple watch一樣的關注熱度,發布后三星也大力宣傳,但終銷量平平。
可穿戴設備的需求究竟如何,目前依舊是一個謎。一旦硬件產品本身賣不出去,接著的問題就是“皮之不存,毛將焉附”,整個生態系統本身的投資和開發都會受到影響。
版權與免責聲明:
凡本網注明“來源:智慧城市網”的所有作品,均為浙江興旺寶明通網絡有限公司-智慧城市網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智慧城市網”。違反上述聲明者,本網將追究其相關法律責任。
本網轉載并注明自其它來源(非智慧城市網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。