【
中國安防展覽網(wǎng) 視點跟蹤】 虛火旺盛的2016年眼看著再有十幾天就將成為回憶,如果找一個關(guān)鍵詞來形容這一年,有代表性的一個詞一定是“人工智能(AI)”。縱論2016年人工智能的發(fā)展,在獲得高度關(guān)注度和對普通用戶*式普及的過程中,我們也看到不可避免地出現(xiàn)了一些偽人工智能產(chǎn)品,以及人們過度消費人工智能話題所帶來的疲憊和審丑。
12月4日的撫摸節(jié)(F&M創(chuàng)新節(jié))上,將人工智能話題放在了一個理性的位置上,找了一些并非一味鼓吹人工智能的嘉賓來談人工智能。其中,曾經(jīng)的百度少帥,現(xiàn)在的物靈科技聯(lián)合創(chuàng)始人顧嘉唯,跟我們探討了人工智能該有的樣子——充滿靈性,主動給人發(fā)起對話,“讓人和靈性世界中的機器人共生共存,成為非常好的人機融合的世界”。
充滿靈性才是人工智能該有的樣子
以下是演講文字實錄:
之前幾次都是代表人工智能行業(yè)比較大型的公司——微軟和百度,現(xiàn)在代表一個小公司,新成立的一家公司——物靈科技,2016年剛成立,希望未來可以像科大訊飛一樣,成為智能行業(yè)新的大型的公司。今天的主題要講講從萬物互聯(lián)到萬物智能,我們是怎么思考的。
未來人工智能的兩個終點
我們現(xiàn)在很多人每天每時每刻離不開手機,手機一直聯(lián)著網(wǎng),所有的信息都通過手機查看。我自己已經(jīng)把微信的提醒關(guān)掉,因為我根本沒有辦法掌握這些信息,(因為它)*充斥著我的生活。我的生活在于移動的生活和每時每刻手機端跟萬物互聯(lián)的過程。
那么,我們將走向什么地方,或者我們認(rèn)為人工智能、深度學(xué)習(xí)、大數(shù)據(jù),在我們身邊成為基礎(chǔ)建設(shè),像水電煤一樣鋪設(shè)以后,我們會走向什么樣的階段。
上一個時代是移動和互聯(lián),下一個時代我們將面臨的是無處不在的計算。我們將面臨是所有萬物都被智能化的過程,可能我身邊的一杯水、一個投影儀、身邊的沙發(fā)就變成了一個機器人。
這里面存在非常大的挑戰(zhàn)。我們這家公司為什么現(xiàn)在成立來做(人工智能)這件事情。我之前花很多的時間在企業(yè)的研究院做了非常多的技術(shù)研發(fā),當(dāng)時微軟是5-10年的研發(fā),百度IDL(Institute of deep Learning 深度學(xué)習(xí)實驗室)是1-3年的技術(shù)研發(fā),嘗試找到對深度學(xué)習(xí)領(lǐng)域的邊界,然后突破。
我們新做的公司希望看到什么使命?我們希望創(chuàng)造人機共生的世界,制造具有靈性的產(chǎn)品。今天有很多很多所謂的機器人產(chǎn)品,要不就是兩個腳的、會跳舞的機器人,要不就是長得像蛋一樣的等著講話的機器人,它們背后用的都是科大訊飛等幾家的語音技術(shù),效果方面就會令人非常非常不滿意。我們希望創(chuàng)造有靈性的產(chǎn)品,讓人和靈性世界中的機器人共生共存,成為非常好的人機融合的世界。
人工智能未來有兩個終點,一個終點是賈維斯那樣的、像《Her》電影里的Samantha 這樣的OS操作系統(tǒng),可以幫助人解決很多問題,可以理解為雇了助理,可以幫你解決身邊所有的事情。第二個終點是寵物,或者在身邊可以陪伴你的情感機器人。這兩類的東西不一樣,我們在路徑中推進的時候做的方法也是不一樣的。
技術(shù)如何適應(yīng)人類?
今天手機發(fā)展到這個階段會帶來非常不好的東西,人需要適應(yīng)它,低著頭看,越來越多地錯過了你與身邊人的交流。
是不是真的應(yīng)該讓人適應(yīng)技術(shù),讓人適應(yīng)科技呢?我們應(yīng)該做的是,努力讓技術(shù)適應(yīng)人,或者說讓技術(shù)隱藏在背后。
原來在之前的兩家公司很多行業(yè)分享會講了很多Deep Learning的東西,但我覺得大部分的大眾不在意或者說不喜歡聽這些東西。他們可能更想獲得是,人工智能到底解決什么問題,能帶來什么快樂,幫我們賺了什么錢。
那能不能讓技術(shù)藏在背后,用戶可以獲得的是靈性的體驗和有價值的產(chǎn)品?
科技沒有很好的隱藏在背后,而是暴露在人面前,讓人適應(yīng)它。為什么有今天的狀態(tài),回顧過去這段時間人機交互的發(fā)展,早是基于PC時代的交互;70年代普及,所有人都有電腦以后,人們進入GUI(Graphical User Interface,圖形用戶界面)的時代。2006年,喬布斯把人們從固定的狀態(tài)帶到了mobile時代,人與人的交互變成了人對玻璃屏幕交互的過程,你的信息再生動、再有情感,都是通過冷冰冰的屏幕交互的。
我印象很深的是,在微軟的四年時間里,一直在努力找的新方式就是NUI(Natural User Interface),自然的人機交互的方式。我們通過語音、手勢、觸覺反饋,去創(chuàng)造。你自己就是一個界面,創(chuàng)造自然交互。
現(xiàn)在,語音形式或?qū)υ捫问降慕换ィ饾u成為我們這波技術(shù)突破大的領(lǐng)域。但光有語音是不夠的,雙向的多模態(tài)交互非常重要,你需要糅合計算機視覺和語音技術(shù)等做多模態(tài)的、跟物體和身邊已經(jīng)變成機器人的設(shè)備進行對話的方式。
錯過了移動互聯(lián)網(wǎng),不能錯過人工智能創(chuàng)業(yè)
從我個人講,我錯過了移動互聯(lián)網(wǎng)時代好的時光。我畢業(yè)后直接去了微軟研究院,做5-10年的技術(shù)儲備,做了非常多的和論文。相反,我有個清華的室友,他畢業(yè)了以后去了盛大,現(xiàn)在做了一個有9億用戶的產(chǎn)品,市值20億美金。
我錯過了移動互聯(lián)網(wǎng),但我發(fā)現(xiàn)這一波新的機會在過去的幾年時間里有積淀,帶來了新的價值。以前人和信息世界、和物理世界的交互通過中間的媒介,大部分來自屏幕,冷冰冰的玻璃。這里面連接的無非就是信息和服務(wù)。
人工智能起來之后,新的這波機會我認(rèn)為有三大塊機會,也是超越App的方式。已經(jīng)有很多人分享說移動互聯(lián)網(wǎng)的創(chuàng)業(yè)機會是非常有限的,人口紅利已經(jīng)過去。以前是通過提率和商業(yè)模式的顛覆去創(chuàng)造移動互聯(lián)網(wǎng)的創(chuàng)業(yè)機會,下一波來自智能行業(yè)的機會一定是由技術(shù)革新帶來的,包括三大類:類是可穿戴設(shè)備,像《Her》電影里的Samantha OS那樣,成為一種無處不在、伴隨的功能性助理,它有計算機視覺;第二類就是中間所有的硬件都變成機器人;第三類就是裝著四個輪子的機器人——無人車。
這個時代我們看到的機會,可能與信息的互動不只是停留在玻璃框中,這是個很明顯的趨勢。第二個趨勢是,越來越多的基于情境型的對話,基于場景的理解之后,讓機器主動跟你互動,而不是人要先跟它講話喚醒它、發(fā)起對話。第三個趨勢是,當(dāng)無處不在的計算發(fā)生后,技術(shù)會隱藏在背后,人享受到的服務(wù)會更不經(jīng)意,而不是一定要拿手機解鎖去看信息。第四個大家都很清楚,可能會帶來安全隱患,身邊這么多的監(jiān)控攝像頭,對個人數(shù)據(jù)獲得后一定會有負(fù)面的東西,怎么讓公司做數(shù)據(jù)源的處理,非常重要。
我們看到的IOT,從萬物互聯(lián)到萬物智能,我們認(rèn)為AI還是弱人工智能階段的時候,用現(xiàn)在傳統(tǒng)的深度學(xué)習(xí)方法做的AI算法,很難完成人們預(yù)期的智能交互。
人工智能商業(yè)化將落在產(chǎn)品經(jīng)理身上
雖然現(xiàn)在很多人高舉AI旗幟,但真正做AI行業(yè)的人很清楚,媒體人眼中有個AI,AI科學(xué)家眼中也有個AI,怎么做商業(yè)化終還是落在產(chǎn)品經(jīng)理的能力上。現(xiàn)在很多的投資機構(gòu)投的都是科學(xué)家,下一波可能真的像java被替代一樣,會變成產(chǎn)品經(jīng)理驅(qū)導(dǎo)的新行業(yè)。
有一個很好的案例——亞馬遜Echo,Echo的本質(zhì)不是簡單的用語音做音響。像iPad當(dāng)年的火爆,在于它顛覆了人們連接音樂數(shù)字的服務(wù),不需要買整張專輯下歌就可以不斷刷新獲得新的數(shù)字服務(wù)。而是,當(dāng)我們花149美金買到一個音箱后,發(fā)現(xiàn)不僅可以語音,后面還可以(用它)買東西。這種用戶預(yù)期控制得很好的初期,不斷提升用戶預(yù)期的過程,才是好的產(chǎn)品經(jīng)理應(yīng)該把握的。
Echo很像當(dāng)年的功能手機,我們有一個產(chǎn)品叫Jibo,是我們?nèi)ツ晖顿Y的一家公司,我們物靈(科技)的母體公司是東方網(wǎng)力Netposa。我們希望通過投資布局和自研,共同找到我們認(rèn)為有靈性的產(chǎn)品矩陣。
Jibo是我們認(rèn)為比Echo更像智能手機的IOT Hub,它會成為家庭當(dāng)中的成員,它會主動地察言觀色、勤于思考,可以插科打諢講笑話,你在點歌的時候可能會給你講這首歌背后的故事。人工智能在做商業(yè)化的過程里,確實有非常多不確定性因素,這比當(dāng)年做移動互聯(lián)網(wǎng)的時候機會雖然更大,但挑戰(zhàn)會更大。
Jibo是物聯(lián)網(wǎng)的入口,可以知道場景的環(huán)境變化,像信息交互界面的接口一樣主動講話。舉個例子,當(dāng)你今天生病回到房間,可以自動與家居連通,但是人的多動性很復(fù)雜,需要一個溫情的方式與你互動,讓你重新拿到?jīng)Q策的權(quán)限然后控制它。怎么把這個體驗做得更加有靈性,從消費升級到體驗升級,這樣的產(chǎn)品就有機會了。
我們希望把人們從萬物互聯(lián)、*聯(lián)網(wǎng)的狀態(tài)脫離出來,讓身邊的每一個硬件都有耳朵、有嘴巴、有眼睛,不止會講話,能夠跟人進行雙向互動,更希望去創(chuàng)造一個人機融合的新的靈性世界。
現(xiàn)在,你在谷歌和百度上搜AI,你會發(fā)現(xiàn)非常多負(fù)面的東西,媒體經(jīng)常會把這些東西過度炒作。比如說,一個掃地機器人吃了女人的頭發(fā),特斯拉把人撞死了,實際上,AI本質(zhì)在于解決問題,看誰怎么用。真正在用這些商業(yè)化AI的人,或者說當(dāng)AI變成水電煤、成為移動互聯(lián)網(wǎng)基礎(chǔ)建設(shè)的時候,應(yīng)該思考的是怎樣很好地讓人的世界觀和價值觀與產(chǎn)品結(jié)合。
我們希望通過我們的點物賦靈,對靈性的理解,來自萬物有靈的感知,轉(zhuǎn)化成我們的靈性理解、靈性互動,放在產(chǎn)品中去,首先夯實技術(shù)。我們也希望同行業(yè)小伙們一起努力,改造身邊那些人工智障機器人,打造有靈性的人工智能產(chǎn)品。