上周五,微軟為它的人工智能機器人“小冰”舉行了一場成人禮。
從2014年5月29日發(fā)布以來,“小冰”已經(jīng)更新到了第四代,年紀也從16歲長到了18歲。過去兩年多時間里,小冰在微信、微博、美圖等平臺上積累了上千萬的用戶,對話量超過了200億條。
在相互的對話過程中,她也表現(xiàn)得越來越像一個正常人。比如她可以識別你發(fā)給她的圖片,能在文字和語音之間進行切換,能夠采用某種“策略”把你帶出消極情緒,甚至,可以跟你打電話。
“小冰”已經(jīng)成為了微軟在人工智能領(lǐng)域的一個戰(zhàn)略級產(chǎn)品,而作為這個項目的領(lǐng)導(dǎo)者之一,微軟全球執(zhí)行副總裁陸奇也從美國飛到了北京。在發(fā)布會結(jié)束之后,他跟我們聊起了小冰、微軟的人工智能戰(zhàn)略,還有如何在過去幾年進行產(chǎn)品和業(yè)務(wù)轉(zhuǎn)型升級。
陸奇認為,人工智能最終將表現(xiàn)在“對話”這個核心的訴求點上。當人工智能可以向電影《她》中那樣與人類自然對話,與人類產(chǎn)生情感聯(lián)系,那么將給整個社會帶來巨在的變化。而微軟小冰已經(jīng)在這條路上走了兩年多。
陸奇在進入微軟之前,很長一段時間就職于雅虎。當被問到微軟這個巨人應(yīng)該如何轉(zhuǎn)身,而避免雅虎的悲劇時,他覺得兩個公司面臨的情況并不太相同。雅虎的門戶已經(jīng)被搜索引擎和社交網(wǎng)絡(luò)取代,而微軟在借助云計算技術(shù)之后,把原有的產(chǎn)品重新推向了一個更為廣闊的市場。
以下是采訪實錄。
關(guān)于微軟小冰
問:小冰一個很大的特色是它的情感計算框架。但是人類的情感是很復(fù)雜的,包括積極的情感、消極的情感。從目前現(xiàn)看,小冰基本上表現(xiàn)的都是積極的情感,與人平等的對話可能會涉及消極的表達,小冰在這方面會有學(xué)習(xí)嗎?
陸奇:按照我們?nèi)斯ぶ悄堋⒋髷?shù)據(jù)和機器學(xué)習(xí)技術(shù),人的情感只要有數(shù)字化的介入,行為的規(guī)范基本上是可以學(xué)出來的。微軟想要建立人工智能是代表正能量的,是為人類服務(wù),幫助人類的。所以在這種情況下,我們想要建立的對話,采用的策略,基本上引導(dǎo)人類從他的消極或者負面環(huán)境(中走出來)。
問:小冰已經(jīng)可以做到和人類打電話了。但人和機器之間文字的交流,實時的講話,實時的了解人的語境,進行語音的反饋,這方面是挺難的吧?
陸奇:從某種意義上來講,我們?yōu)槿斯ぶ悄芩a(chǎn)生的對話能力,提出了一個新的標準,如何在實時性方向,非常智能的,就像人與人之間交流,確實技術(shù)上有很大的問題。
我們首先要聽得懂,語音識別要非常清楚,速度得非常非常快;第二,交互的能力非常廣,但是如何把這些技術(shù),有難度的核心技術(shù)提高到一定的層次,把它集合起來,使整個的用戶體驗,真的像人與人之間智能交互,這是非常重要的。
剛才有一位女士上去試了一下,小冰可能今天沒法測試說今天給我打電話的是個男的還是女的,有很多事情要解決。
問:為什么要賦予小冰這樣一種實時對話的能力?
陸奇:人類跟任何種類不一樣的地方,我們發(fā)明了語言,人與人之間近距離的交換,后來有了電話以后,可以遠距離的交換,就是實時的交換,不光把人類進化,而且產(chǎn)生人類知識,人生整個演進過程中起了非常大的作用,人工智能會成為新的人與人之間交流的基準橋梁。
其實是蠻振奮人心的,雖然我們沒有完全把技術(shù)問題解決,但是我們至少定義了這是一個新的里程碑,將來不管是機器人也好,它是一個自然的交流形式,完全可以連續(xù)實時的、可以不斷的,毫無保留的講。
問:我們離這個理想的自然交流狀態(tài)有多遠?
陸奇:根據(jù)我們現(xiàn)在的深度學(xué)習(xí)技術(shù),只是一個時間問題。把數(shù)據(jù)輸進去,不斷地去訓(xùn)練,在2009年之前,錯誤率接近30%,這么幾年已經(jīng)從30%降到8%,可以預(yù)測再過一兩年,就差不多1.5%左右,這也是我們技術(shù)上可以解決的。
我們的語音團隊是全球性的團隊,小冰在開拓性領(lǐng)域,我在美國的語音團隊他們講,他們必須把中文的優(yōu)先級繼續(xù)提高,小冰從技術(shù)上來講,用戶體驗上是全球領(lǐng)先的。今天演示的時候,我們還是比較緊張的,錯誤率在8%左右,一旦聽不準以后,接下來的交互完全不準確了。
問:在開發(fā)小冰日語版的時候,是基于中文翻譯平臺,還是從零開始,本地語言開發(fā)出來?
陸奇:從零開始,文化語言環(huán)境完全不一樣。一開始我們跟項目負責(zé)人有過討論,是不是這個產(chǎn)品只有中國玩的轉(zhuǎn)?我們說至少試試,看哪個國家哪個語言跟我們接近,就是日本。試下來以后我們就知道了,這個產(chǎn)品肯定是全球化的。但是每個國家必須要從零開始,因為每個國家的語言和文化不一樣,你沒法搬過去。
問:現(xiàn)在做人工智能其實是用深度學(xué)習(xí)的方式,利用現(xiàn)有的很多樣本。那微軟是怎么樣產(chǎn)生這樣的樣本的?人工給一個圖片,或者一段話分析他的情感,給小冰來訓(xùn)練嗎?
陸奇:從算法上來說,機器學(xué)習(xí)從整個歷史上來講有幾種大的方式,一種是你有樣本,真正做到人工智能的有非常大的限制。AlphaGo最大的創(chuàng)新,是使用了增強學(xué)習(xí),可以自我學(xué)習(xí),但是這也有它的限制,它的限制就是你探索的環(huán)境多大,如果探索環(huán)境不大的話,你學(xué)來學(xué)去,就是學(xué)一個封閉的系統(tǒng)。
我們公司的團隊研發(fā)遷移,我自己個人也做了不少,人與人之間知識可以傳輸?shù)模w移也必須要做。最后還要解決一部分問題,人一部分的知識,我沒有做增強,也沒有人來教我,我自己琢磨。所以人的知識就是三部分把它總結(jié)起來,增強學(xué)習(xí),這是三部分學(xué)習(xí)的方式,我們微軟這方面做的研發(fā)做的比較多。
問:小冰各方面的能力,對情感的把握和去年相比有很大的提升,微軟有沒有想過把商業(yè)化給提上議程?
陸奇:小冰的盈利空間是非常大的,我們完全有機會創(chuàng)建新一代盈利形式,跟搜索廣告一樣,我覺得搜索廣告可能是盈利最好的代表。
為什么搜索廣告業(yè)務(wù)有效性非常強,同時用戶體驗可以維持在很高的水平,有幾個層面,第一個,信息結(jié)構(gòu)。搜索廣告和自然搜索的結(jié)果是完全一樣,都是針對關(guān)鍵詞。第二,用戶體驗也是百分之百吻合;第三,搜索廣告效益完全可以百分之百用精準的方法來測試;第四,搜索廣告盈利體系是建立市場機制,每個廣告商要不斷地提高廣告的質(zhì)量。
像小冰這樣的產(chǎn)品,它的戰(zhàn)略意義,對整個生態(tài)系統(tǒng)的廣泛度,在這個階段我對團隊的要求,基本上是完全注重用戶體驗和生態(tài)系統(tǒng)的健康。如果過早的做盈利,用戶體驗會受到損傷,整個生態(tài)系統(tǒng)會受到一些約束,我們覺得這個是不值得,在這方面,一定要把基礎(chǔ)打扎實才行。
問:您剛剛提到了用戶體驗,要做用戶體驗可做的事情非常多,而且是一個很龐雜的系統(tǒng)工程,微軟在內(nèi)部有沒有一套自己制定的標準或者是方法,把它變成有規(guī)劃性的事情?
陸奇:我們整個工業(yè)創(chuàng)新的核心是在三個圓圈的結(jié)合,第一個圓圈是人類的需求;第二個圓圈是技術(shù)上是否可行;第三個圓圈是商業(yè)上能不能建立有效的商業(yè),這三個必須都成立才行。其中人的需求是最難預(yù)測的,最難預(yù)測的是將來。
目前美國科技公司成績做的最好,發(fā)展?jié)摿ψ顝姡谝皇荈acebook,第二是蘋果,這兩個共同有共同點,他們都是產(chǎn)品研發(fā),技術(shù)對他們來講是一個工具,他們公司著重點如何把用戶體驗做的越簡單、越精準。在中國,我個人覺得現(xiàn)在實力最強的是騰訊,騰訊完全是一個產(chǎn)品導(dǎo)向。張小龍以前有一個PPT講微信哲學(xué),我們把它翻譯成英文,給我的團隊去講。
在新一代,在移動和云這塊,手機也好,手表也好,這些數(shù)字化的用戶體驗已經(jīng)不再是一個工具,是個體的延伸,我們對它要求是非常非常高。我個人覺得用戶體驗的簡單、精準,對整個公司起著戰(zhàn)略性的作用越來越大,技術(shù)當然永遠是最重要,但是用戶體驗是下一代企業(yè)核心競爭力。
微軟的傳統(tǒng)文化是比較注重技術(shù),這是好事情,我們還是繼續(xù)重視技術(shù),但是我們必須要改進我們的文化,不斷地執(zhí)著的追求用戶體驗的簡單,世界上可能最復(fù)雜的事情把用戶體驗做的簡單,做到簡單的用戶體驗是絕對不容易的。
問:小冰后面有很多的技術(shù)支持,包括云計算平臺,云平臺在印度,包括像醫(yī)療、農(nóng)業(yè)合作非常好,微軟會在這方面和中國政府有合作嗎?
陸奇:微軟把云計算的技術(shù)投入是作為核心。如果沒有云的技術(shù),大規(guī)模的數(shù)據(jù)處理,包括語音處理也好,機器學(xué)習(xí)也好,都沒法完全往前推。剛才你講到在印度做醫(yī)療、農(nóng)業(yè),我們在中國是非常非常有信心,跟中國政府也好,跟中國國企也好,建立雙贏的關(guān)系。
我個人并沒有了解具體的案例,但是我是完全相信,我們公司是非常愿意。我個人自己也是參與很多在美國跟醫(yī)療有關(guān)、農(nóng)業(yè)有關(guān)的項目,在美國找到合作伙伴,云計算、人工智能、大數(shù)據(jù)的技術(shù)真正推進社會往前發(fā)展,不光是商業(yè),對整個社會都可以用這個方向推進。
問:目前在小冰上的研發(fā)投入大概有怎樣的金額數(shù)量級?
陸奇:第一,打仗不是看人多,關(guān)鍵是要看團隊的質(zhì)量。第二,你必須運用當?shù)氐奶厥獾膭?chuàng)新環(huán)境。第三,在微軟基本上強調(diào)全球共享。
從小冰開發(fā)上來講,我們現(xiàn)在的團隊也是非常強,人數(shù)未必多,但是創(chuàng)新的質(zhì)量、創(chuàng)新的速度是非常快的。團隊也充分利用了中國獨特的微信、微博這些平臺。同時我們充分利用了全球的技術(shù),語音是全球共享的,大數(shù)據(jù)的東西很多都是全球共享的,我們美國很多團隊做了很多基礎(chǔ)研究來支持這里的團隊。我不能說有多少資金花進去,但可以說我們領(lǐng)兵打仗的能力多強,我們創(chuàng)新的環(huán)境是多么有效,我們?nèi)虻钠放剖侨绾卫闷饋怼?/span>
關(guān)于人工智能
問:從計算機科學(xué)家角度來講,現(xiàn)階段的解決方式是深度學(xué)習(xí),生物學(xué)家對人類思考的過程并不是非常清楚,他們并不代表真正的智能,不知道從計算機科學(xué)家角度來講,人工智能的方向是怎么樣的?
陸奇:我們整個工業(yè)一直在往前走,但是也未必大家是100%有同樣的定義。雖然人是目前為止智能行為最好的代表,但是我們工業(yè)要有一個比較更遠大的想法。
我們?yōu)槭裁茨馨l(fā)明飛機?我們不是想去重復(fù)一只鳥,鳥是怎么飛,我們把鳥飛的核心能力找到以后,我們建立一個比鳥更強大的實體,智能也是一樣,人是怎么產(chǎn)生智能系統(tǒng),把這個規(guī)則拿過來,同時用這個規(guī)則建立更強大的系統(tǒng),為整個社會帶來正的影響。
問:那微軟認為如何去定義真正的智能呢?
陸奇:智能的定義是說我們有這樣一個系統(tǒng),可以自動的獲取知識,來代表知識,可以自動的來完成他需要達到的目的,這就是智能。
如果按照這個定義,我們的工業(yè)在這個方向,我個人覺得已經(jīng)走的很健康了,有幾個大的環(huán)節(jié)要往前走,我們怎么建立一個系統(tǒng),它有一個所謂廣義的智能。
問:狹義的智能和廣義的智能區(qū)別是什么?
陸奇:現(xiàn)在所有的智能大部分提的都是狹義的智能系統(tǒng),比方說以前有象棋機,打敗世界冠軍了,這個象棋機雖然可以打敗世界冠軍,但是換一個別的游戲,再怎么簡單的,它也不會下。我們現(xiàn)在要建立的是一個智能系統(tǒng),可以完成很多很多任務(wù),小冰是一個例子,但是有很多其他地方可以做。在微軟我們也是投入了很多機器學(xué)習(xí)、人工智能方面的研發(fā),我們的宗旨是通過微軟的產(chǎn)品建立NGI(NextGenerationInternet,下一代互聯(lián)網(wǎng)),造福人類。
問:您覺得這個廣義的智能系統(tǒng)什么時候會出現(xiàn)?
陸奇:我自己做人工智能也是花了不少精力,做了很多系統(tǒng)、算法、產(chǎn)品,我覺得我是比較樂觀派,如果我們整個工業(yè)能夠順利往前走的話,25年,甚至于25年不到,我們就有一個系統(tǒng)是廣義的,可以自動的不斷獲取知識,自動來解決很多世界上的問題,我覺得將來的世界是一個非常非常美好的世界,我個人覺得,中國在這個世界舞臺上,能夠扮演的地位和重要性會越來越大,因為中國人才、數(shù)據(jù)、創(chuàng)新的速度、創(chuàng)新的空間,我個人覺得有得天獨厚的優(yōu)勢。
問:能跟我們介紹一下微軟在機器學(xué)習(xí)、計算能力擴容方面的最新進展嗎?
陸奇:微軟在人工智能投入上其實是非常重視的,我們不光是我的團隊,不光是做應(yīng)用的團隊,我們跟微軟研究院有很大的合作,包括幾方面,第一,人工智能的計算必須要推進;第二,我們必須對軟件工具,你剛才講了有CNTK,跟谷歌(微博)的TensorFlow基本上是一樣的,我們用CNTK具體實現(xiàn)微軟的核心產(chǎn)品,包括像Bing的搜索引擎、Office365里面很多的智能軟件都是用CNTK。
我們大規(guī)模投入FPGA,現(xiàn)在在微軟,所有的Bing和Office365和Azure服務(wù)器,我們都插了FPGA的插件。FPGA可以幫助我們做加速處理,我們現(xiàn)在主攻的就是加速處理,深度學(xué)習(xí),我們可以大規(guī)模的模型訓(xùn)練。
問:為什么這個插件如此重要?
陸奇:比方說一個車子在開,或者一架飛機在飛,必須在很短時間做決定,所以模型的速度必須非常快,同時模型又是很大,數(shù)量很多,F(xiàn)PGA給我們公司戰(zhàn)略上帶來很大的研究創(chuàng)新的效益,我們現(xiàn)在在Azure上,用GPU、FPGA加速的,在將來會在Azure上提供。
關(guān)于微軟轉(zhuǎn)型和新業(yè)務(wù)發(fā)展
問:您曾經(jīng)在雅虎工作了很長時間,見證了這家公司從崛起到衰落。目前微軟也在經(jīng)歷這樣的轉(zhuǎn)型,您覺得它可以從雅虎的身上吸取什么樣的教訓(xùn)。
陸奇:回過頭來看一下IT工業(yè)的歷史,每隔20年左右,會有一個新時代出來,從PC到互聯(lián)網(wǎng)到云,我們戰(zhàn)略已經(jīng)定位了。
微軟跟雅虎有一個本質(zhì)的區(qū)別,雅虎的產(chǎn)品,他的門戶網(wǎng)站用戶已經(jīng)覺得不是很有用,社交網(wǎng)站、搜索引擎取代他了。而微軟的核心產(chǎn)品是生產(chǎn)效益的軟件和服務(wù),生產(chǎn)效益軟件和服務(wù)由于云,這個業(yè)務(wù)不光不會往夕陽走,而且會增長。
問:能夠具體跟我們解釋一下“云”帶來這種新的變化嗎?
陸奇:生產(chǎn)效益的軟件在PC的時代,能夠達到的已經(jīng)在辦公室里面,坐在辦公室桌上可以有一臺PC,所以微軟歷史上的顧客有12億客戶,都是坐在辦公室里面,處理信息的那些人。
由于有了手機,有了云以后,實際上用手機、用云的人至少有三十億到四十億,這些人需要新一代的工具,幫助他們更有生產(chǎn)效益,一旦把微軟的核心業(yè)務(wù)變到云之后,我們的業(yè)務(wù)不光是不會往下縮,或者變成沒有效益,而且我們的空間變得更大。
微軟確實在歷史上是不同的地位,我們也看到這樣的機會,云雖然對我們有一個的顛覆性,但是給我們帶來更大的空間,看到這種情況,毫無疑問,把所有的公司統(tǒng)統(tǒng)往云里面轉(zhuǎn)移。
問:這種轉(zhuǎn)移對于內(nèi)容產(chǎn)品開發(fā)和公司文化帶來了什么樣的變化?
陸奇:舉個例子,我接管我現(xiàn)在Office團隊三年不到,我接手的時候,Office每一年歇服一次,整個團隊6個月沒有人寫任何程序,有6個月做計劃。我們現(xiàn)在從今年1月份開始,整個Office每個月都寫,而且已經(jīng)變成一個服務(wù),這對整個團隊運營文化、開發(fā)文化,怎么做計劃,真的是一個很大的改造過程。
我們的商業(yè)模式也和以前不一樣了。Office原來的商業(yè)模式賣授權(quán),現(xiàn)在是賣給人家服務(wù),就是你每個月去買,或者每年去買,賣的方式怎么做到有效性也是不一樣。
問:微軟的云業(yè)務(wù)從三年前的500萬美元變成了現(xiàn)在的95億美元,其中大部分是由Office365代替了原來的Office產(chǎn)品。做為這個團隊的負責(zé)人,怎么來保證在新老交替過程中保證KPI的公正合理,維持團隊的穩(wěn)定和士氣?
陸奇:Office變成Office365,其實是兩個層面同時并行,第一是現(xiàn)有的客戶,從原來的產(chǎn)品轉(zhuǎn)化成新的產(chǎn)品,也就是說你沒有多賺錢,只是把原來賺錢的方式改成新的賺錢方式,這些錢還是微軟賺的錢,同時客戶的體驗更好。
我們的KPI有兩大類—成績和權(quán)益,業(yè)務(wù)的成績有多少,這不代表將來,這代表你過去。權(quán)益是另外一對KPI,也就是說用戶的數(shù)量有多少,我們比較重視的是數(shù)量,我們每個都看我們數(shù)量有多少,我個人推的最厲害的,一定要重視權(quán)益,光有成績沒有權(quán)益的話,你公司將來的前景是不會很長的,所以這兩方面一起推,就是成績和權(quán)益,衡量整體的KPI,這是現(xiàn)在Office團隊轉(zhuǎn)型過程當中最重要的一點。
問:怎么來保證客戶會長期使用微軟的產(chǎn)品,而不會轉(zhuǎn)向競爭對手呢?
陸奇:現(xiàn)在云服務(wù)是一個實時性的,同樣是一個Office,同樣是一個電子郵箱,一旦在云端之后,你是怎么用你的郵箱,你平時郵箱里面送什么樣的信息,這都是你的數(shù)據(jù),但是我們完全可以做實時的分析,我們可以建一張知識圖譜。
比方說你是銷售團隊,你跟你的客戶是怎么合作的,你跟你的團隊是怎么合作的。一旦建立這樣的模式之后,我們可以做很多預(yù)測、很多自動化。
所以進了云端以后,我們以前在商業(yè)上也做了一個測試,一旦Office365,同樣一個客戶,我們覺得將來十年、二十年,可能是要百分之六百增長,我們可以把服務(wù)的層次提供的非常高,主要是靠人工智能,靠大數(shù)據(jù)來提高。
(審核編輯: 智匯胡妮)
分享