【
中國安防展覽網 視點跟蹤】 百度這兩年年在人工智能能上是下足了功夫,無人車、百度大腦、百度人工智能機器人都昭示了百度強大的技術力量,霸滿了新聞頭條。人們在驚嘆的同時也在好奇,百度下一步打算做什么?
林元慶:百度在人臉識別上走的是技術路線
2月21日,《麻省理工科技評論》公布了2017年度突破技術,其中的“刷臉支付”一項,代表公司主要為百度等以中國為主要市場的公司。在參加完MIT科技評論年度突破技術中國發布會現場演講后,百度深度學習實驗室(IDL)主任林元慶接受了采訪。
林元慶透露,百度人臉識別技術在2016年取得“突破性(進展)”,百度花了很多力量在研發和推廣該技術。在林元慶看來,百度人工智能機器人在《強大腦》圖像識別環節3:2戰勝人類,“是一個標志性事件。”
“百度進入人臉識別行業,走的是技術路線”
“人臉識別技術,就算在一些的情況下,百度都能做得很。”林元慶稱。人臉識別是圖像識別的一種。百度圖像技術是基于深度學習算法,可以智能識別圖像中的文字內容和含義、分析人臉圖像以及檢測圖片色情度的人工智能技術。百度圖像技術分為文字識別、人臉識別、黃反識別等。
林元慶一直在強調技術的重要性,“百度進入人臉識別行業,走的是技術路線。”作為百度圖像識別的核心技術,百度人臉識別可以實現人臉檢測、人臉對比、人臉查找,并已應用于百度魔圖、百度網盤、百度識圖等產品中。
以在百度內部測試的人臉識別閘機為例,其基于深度神經網絡機器學習算法對檢測到的多個人臉面部特征點進行學習、識別。整個項目貫穿了研發、硬件、技術支持、深度學習實驗室、AI平臺部、流程信息管理部以及內部溝通部等部門。
與一些做人臉識別的初創公司相比,百度在人臉識別技術上優勢明顯。除了有吳恩達、林元慶等業界技術“坐鎮”,還與其在計算、數據、算法上的投入和積累密不可分。據介紹,百度已布設數十萬臺服務器,研發的超級計算機Minwa,相當于2個天河一號。在數據方面,百度全網已存儲萬億網頁EB級數據。在算法上,百度已達到大規模的DNN,支持萬億參數、千億樣本、千億特征訓練。
此外,百度人臉識別技術將和百度的其他人工智能技術協同起來,形成多模塊的保障。“人工智能在自動駕駛、金融產品等方面的應用,人臉識別只是其中一個模塊,百度還會增加大數據等多模塊的保障。并且需要每個方面都做得特別好。”林元慶表示“人工智能很多技術,做一套系統很容易,但是要做一套很多人都在用的系統,是有非常高的技術門檻的。”
“1:N人臉識別技術,百度是行業*。”林元慶表示。林元慶不避諱百度人臉識別技術在研發過程中的缺陷。林元慶介紹,百度大廈的人臉識別閘機,大約在半年前開始布局,“剛開始問題挺多,識別的精度,光線的影響,還發生了不是百度的人也放進去的情況。”林元慶接著表示,“我們一直在調系統,現在,百度的免工卡刷臉通行閘機系統基本上能夠做到把非百度公司的人拒之門外。”
在林元慶看來,身份認證的高境界就是不用認證,“人就直接走。”百度科學家吳恩達此前表示,目前核心的人工智能技術就是圖像技術,因為需要使用圖像技術來理解這張圖里面的內容到底是什么,也需要用圖像技術來做視覺定位,才可以實時把虛擬技術放進去,如果有人臉也可以做虛擬內容。
百度方面宣稱,目前,百度人臉識別準確率達99.7%,在人臉識別技術兩個為的評測——FDDB與LFW中已經獲得了雙料世界。
百度人臉識別商業化
林元慶坦承,百度人臉識別技術在商業化方面“有點滯后”。
在場景應用上,林元慶透露,百度在2016年主要將人臉識別技術應用到百度內部上線的“免工卡刷臉通行閘機”,以及游客通過“刷臉”在烏鎮景區各處閘機處通行(游客需要在入園時提供*掃描并錄入一張實時拍攝照片)。此外,百度還與泰康人壽達成合作,將人臉識別技術用于微信投保的回執和回訪環節,在線校驗客戶身份。
林元慶透露,2017年,至少會有100個4A、級旅游景區啟用百度人臉識別系統。如果說2016年是百度人臉識別技術取得“突破性進展”的一年,那2017年將會是它的落地之年。
林元慶透露,目前,百度已經在內部確定了人臉識別技術的四大落地方向:1,閘機。百度希望將“刷臉通行閘機”落地到景區,以及大企業和大型寫字樓里;2,交通。目前,百度在非常積極地尋求和火車站、機場達成合作;3,金融。長遠來看,金融方面是百度人臉識別重要的應用方向;4,手機。“百度和國內幾大手機廠商在談人臉識別技術上的合作。希望有一天能夠像指紋一樣代替鍵盤。”
在百度視之為人臉識別重要應用方向的金融領域,百度借助大數據+人工智能技術,百度風控部門已經為有信貸需求的群體繪制用戶畫像,建立信用體系,加上圖像識別等人工智能技術的實際應用,構成了遠程授信的技術基礎。
“百度非常喜歡有一定門檻的技術,百度在(這樣的技術)方面能做出好的應用。”林元慶表示。林元慶透露,百度人臉識別技術主要由IDL主導。“公司沒給我們定硬性指標。我們是有KPI的,但會更聚焦過程。會定收入目標,但現在很多技術都還處于探索階段,定多、定少都不合適。”林元慶透露。
林元慶一再強調,百度在人臉識別技術上奉行技術為先的策略,因此其商業落地的案例不多。
2017年春節前夕,“票證人自助核驗閘機”(“刷臉檢票”系統)“火”了一把,該系統在北京、上海、廣州、深圳等多地大型火車站投入使用。日本電氣股份有限公司(NEC)是該刷臉進站系統的研發方之一。林元慶稱,“鐵路相關部門沒有來找百度,百度也沒有去找過他們。”
林元慶透露,《強大腦》節目組一開始也不知道百度在研發人臉識別技術,還透露有美國、歐洲的公司就人臉識別技術在與百度積極接觸,希望百度人臉識別技術能夠應用到他們的產品中。“特別是幾家美國公司,我們覺得挺不錯的,他們原本應該是找谷歌的。”林元慶稱。
軟硬件結合
除了商業化,百度人臉識別技術還在做軟硬件結合的嘗試。
林元慶透露,進景區的閘機,百度也需要在硬件上一體化的維度來做優化。在解決景區下午過曬的陽光影響攝像頭工作的問題,百度也在考慮能否開發出來足夠好的攝像頭,把主要的曝光集中在人臉上。“現在,人工智能技術很多要落地的話,很多的系統都需要考慮軟硬結合,把性能給真正地發揮出來。”林元慶表示。
林元慶進一步表示,百度原來覺得不需要做硬件,也盡量不做硬件。現在,百度挺強調軟件結合。“因為這也是應用驅動的,我們也不是一成不變的。”林元慶說。
百度在硬件制作上已經開始行動了。其中的一個例子是,2月16日,百度宣布全資收購渡鴉科技有限責任公司,創始人呂騁攜團隊正式加盟百度,并出任百度智能家居硬件總經理。
除了計算、數據、算法方面的優勢,百度人臉識別有其獨到的研發策略。
林元慶介紹說,人臉識別技術方面,形成閉環是非常重要的。算一個數據,研發步的技術,做代的產品,產品到給用戶,用戶產生數據,數據回來進一步提高技術,獲得更多的數據、更好的算法。“算法并非一成不變,很多時候算法和技術是一起發展的。這才是非常好的正循環。”林元慶告訴澎湃新聞。
建立人臉識別技術閉環的重要性不僅于此。林元慶表示,一旦建立人臉識別技術的閉環,對收集數據等各方面都將有極大的助力。林元慶還介紹,搜索數據非常重要,搜索到數據之后,還要分類、打標簽,“能告訴你是這個人還是別的人。”
林元慶進一步表示,算法的強弱取決于兩點,一是要去設計比較好的計算方法。在深度學習里面,要設計位置、連線等,以此反映出深度學習的一些架構。二是要有足夠多的數據,以及能把這個算法“訓練”出來的好項目。
林元慶還表示,百度人臉識別的應用會聚焦在互聯網相關的方向上,“這是我們的競爭優勢所在。安防等領域可能也會涉及,但應該會非常少。”
林元慶透露,百度在人臉識別上的“野心”不止于閘機、交通、金融、手機四大落地方向,它還將與百度地圖、圖片識別、大數據、百度糯米等打包起來,更貼身地服務用戶,以實現百度董事長兼執行官李彥宏在2017年新春內部講話中提出的“連接服務”的目標。
此外,百度人臉識別計劃還將在百度內容分發上大有“作為”。“內容分發是一個非常重要的領域,我們是一定要贏的。”林元慶稱。林元慶還提到,人臉識別技術不一定會應用到百度醫療中。但他透露百度正在搭建一個“非常強大”的醫療圖像分析團隊。
百度方面也坦言,人臉識別技術研究的困難,不同于普通的圖像識別。就人的臉部特征而言,每個人的臉部結構都是相似的,這對于利用人臉區分人類個體不利,還有一些特殊情況,比如雙胞胎甚至多胞胎。其次就是表情、光照條件、整容等外因影響。不同的表情、角度觀察,光照條件的影響,人臉遮蓋物,如口罩、墨鏡、頭發、胡須,甚至是整容、P圖等行為,都增加了人臉識別的難度。
在回答記者提出的“陸奇將怎樣影響百度的人工智能戰略”的問題時,林元慶表示,陸奇的執行力非常強,作為人工智能專家,陸奇非常想知道具體的技術,甚至在算法級別。林元慶透露,他已經和陸奇深度溝通過幾次,“每次和陸總開完會,他總是會要求我給他發幾篇論文。”
“現在,百度在執行力方面會非常強。這是我們特別需要的。”林元慶補充道。在2月21日公布的MIT科技評論年度突破技術榜單中,百度也進入“強化學習(ReinforcementLearning)”、“自動駕駛貨車(Self-DrivingTrucks)”兩項技術的主要公司名單。