聲紋識別,生物識別技術的一種,也稱為說話人識別,是一種通過聲音判別說話人身份的技術。所謂聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。人類語言的產生是人體語言中樞與發音器官之間一個復雜的生理物理過程,人在講話時使用的發聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。每個人的語音聲學特征既有相對穩定性,又有變異性,不是一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環境干擾有關。盡管如此,由于每個人的發音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。
人們為何看重聲紋識別?
人工智能主要有三個研究方向:視覺識別、智能語音、自然語言處理NLP。其中,在語音識別領域,聲紋識別屬于相對藍海市場,解決的主要是“我是我”的問題,多應用在安全驗證場景。在語音轉文字賽道,各家的效果可能趨于0.1%、0.2%的差距,為了避免同質化競爭,許多公司選擇從“聲紋識別”切入。
聲紋識別相對于其他生物識別的優勢主要體現在以下幾點: 一是非接觸式識別,相對于指紋識別而言,它更加便捷;二是降低侵犯隱私風險,相對于人臉識別而言,社會大眾對于聲紋識別的抵觸大大降低,隨便采集到的一段話便可以進行聲紋識別;三是獲取語音的識別成本低,相對于人臉識別、指紋識別等,聲紋識別只要求麥克風便可以進行采集。
公安、金融領域更青睞聲紋識別技術
聲紋識別技術有兩類,即說話人辨認和說話人確認。不同的任務和應用會使用不同的聲紋識別技術。如縮小刑偵范圍時可能需要辨認技術,而銀行交易時則需要確認技術。
2018年10月9日,中國人民銀行正式對外發布《移動金融基于聲紋識別的安全應用技術規范》金融行業標準,這意味著聲紋識別技術得到金融監管部門的認可。這也為聲紋識別技術進入移動金融領域解決了標準難題。
同語音識別技術相比較,聲紋識別的應用領域則更加專業與細分。不止金融領域,公安、司法等領域都需要利用聲紋鑒定人員身份。而在我國,早在上世紀80年代末就已由中國刑警學院文檢系和公安部物證鑒定中心先后引進相關儀器設備并分別建立了聲紋鑒定實驗室,并進一步成立了聲紋鑒定研究課題組,開展了聲紋鑒定技術的研究工作。到現在,在全國各地公安機關的多年共同努力下,針對漢語這一語種*的特點與規律,已然總結出一套科學的鑒定與甄別方法,聲紋識別已成為公共安全領域鑒定人員身份的主要手段之一。
結語
從近幾年情形可以看出,相比于指紋識別、人臉識別等生物識別技術,聲紋識別是“低調”的,但市場需求的確存在,且市場熱度也有上升趨勢。
同時,聲紋識別技術目前已經發展較為成熟,識別準確率也相對較高,應用范圍較為廣泛、識別技術水平相對成熟,因其經濟性、可操作性等優勢,在將來會在更多的領域中、獲得更為廣泛的應用。聲紋識別或是未來提升安防解決方案的重要手段,將快速實現商業化部署,前景十分廣闊。