Google 的人工智能:讓流動的信息產(chǎn)生智能
早在 2001 年,拉里佩奇對于 Google 的定位就是人工智能。這個理念源于拉里·佩奇的恩師威諾格拉德,上世紀(jì) 70 年代,威諾格拉德曾作為MIT人工智能實(shí)驗(yàn)室的一員,一門心思要制造與人類思維匹配的智能。然而威諾格拉德看到所謂人工智能在各個領(lǐng)域的潰敗,同時又受到加州大學(xué)伯克利分校教授塞爾斯「中文房間」理念的啟發(fā),最終退出這個領(lǐng)域。
1998 年,威諾格拉德和他的學(xué)生拉里·佩奇、謝爾蓋·布林及其導(dǎo)師拉杰夫·莫特瓦尼聯(lián)合發(fā)布了一篇學(xué)術(shù)論文《你能用自己口袋里的論文做什么?(What Can You Do with a Web in Your Pocket?)》,該論文提出了谷歌搜索的產(chǎn)品原型。同年,佩奇和布林從斯坦福大學(xué)畢業(yè),創(chuàng)立谷歌,通過改善人類信息組織和發(fā)現(xiàn)的方式,創(chuàng)造一種可以為人類服務(wù)的智能方式。
該論文的概念也體現(xiàn)在 Google 的 Slogon 里:「整合全球信息并為其使用」。因此 Google 對于信息背后的智能方式有著天然的熱愛,硅谷資深記者 Steven Levy 在六年前探訪Google 總部后這樣寫道:
Google 搜索的最大創(chuàng)新是引入新算法 Page Rank。而網(wǎng)絡(luò)搜索是一個多方過程。
首先,谷歌機(jī)器人獲取每個可訪問網(wǎng)站的內(nèi)容。這些數(shù)據(jù)將被分解成一個索引(通過文字進(jìn)行組織,就像書本的目錄),這樣就可以根據(jù)內(nèi)容找到任何頁面。每當(dāng)用戶鍵入一個查詢,谷歌就會在索引中搜尋相關(guān)頁面,然后返回一個包含多達(dá)數(shù)百萬頁面的列表。最復(fù)雜的是對列表進(jìn)行排序,也就是決定哪些頁面應(yīng)該出現(xiàn)在最上面。
此時,上下文便有了用武之地。所有搜索引擎都會引入上下文,但沒有一個像谷歌那樣引入得那樣多、應(yīng)用那樣自如。PageRank本身也是一個信號,同時也是頁面的一個屬性(指其相對于其他網(wǎng)頁的重要性),該屬性可以幫助確定其與查詢內(nèi)容的相關(guān)性,其中的一些信號在現(xiàn)在看來是顯而易見的。
2012年,Google 提出了知識圖譜,所謂知識圖譜,簡而言之就是一種深度挖掘搜索詞潛在的知識關(guān)系,來呈現(xiàn)更結(jié)構(gòu)化的搜索結(jié)果。比如當(dāng)你搜索硅谷,你所看到的不僅僅是關(guān)于硅谷的網(wǎng)頁信息,還提供結(jié)構(gòu)化及詳細(xì)的關(guān)于主題的信息,下圖的右側(cè)就是 Google 的知識圖譜:
將雜亂無章的網(wǎng)頁到結(jié)構(gòu)化的實(shí)體知識,搜索引擎可以通過知識圖譜給用戶提供更具條理的信息,甚至順著知識圖譜可以探索更深入、廣泛和完整的知識體系,讓用戶發(fā)現(xiàn)他們意想不到的知識。Google 高級副總裁艾米特·辛格博士一語道破知識圖譜的重要意義所在:「構(gòu)成這個世界的是實(shí)體,而非字符串(things, not strings)」。
根據(jù) Google 官方的說法,知識圖譜的信息來自許多來源,包括CIA的世界概況,F(xiàn)reebase 和維基百科,通過知識圖譜,Google 在踐行「整合知識并使其可用」方面邁出了堅實(shí)的一步。
2011 年開始,Google 引入深度學(xué)習(xí)框架。深度學(xué)習(xí)并非什么新技術(shù)。上世紀(jì)60年代發(fā)明后,先后在 80 年代和 90 年代初期流行過一整,但隨后就逐漸消沉。但在 Google 看來,深度學(xué)習(xí)需要的海量數(shù)據(jù)恰好也是 Google 最擅長的領(lǐng)域,與此同時,對于計算能力的高要求也是 Google 自身技術(shù)架構(gòu)足以應(yīng)對的。
深度學(xué)習(xí)最開始由吳恩達(dá)推動的Google大腦計劃,Google 技術(shù)大拿 Jeff Dean 也參與其中。當(dāng)時想通過使用神經(jīng)網(wǎng)絡(luò)來提升技術(shù)水準(zhǔn),但并沒有把研究做成像大學(xué)象牙塔那種,而是結(jié)合 Android、Gmail、圖片去改進(jìn)產(chǎn)品解決真正問題。
2012 年 6 月,《紐約時報》率先報道了 Google 大腦項(xiàng)目,吸引了公眾的廣泛關(guān)注。公眾第一次了解到,利用16,000個CPU Core的并行計算平臺去訓(xùn)練含有10億個節(jié)點(diǎn)的深度神經(jīng)網(wǎng)絡(luò)(DNN,Deep Neural Networks),使其能夠自我訓(xùn)練,能夠?qū)崿F(xiàn)對2萬個不同物體的1,400萬張圖片進(jìn)行辨識。
到了 2012 年年底,在業(yè)界關(guān)注的圖片分類的競賽 ImageNet 中,Google 一支采用深度學(xué)習(xí)的精英團(tuán)隊(duì)完敗給 Geoff Hinton 手下的博士生團(tuán)隊(duì)。這也促使 Google 重新開始認(rèn)識深度學(xué)習(xí)帶來的巨大價值,一年后,Google 高價收購了 Geoff Hinton 的團(tuán)隊(duì),并全面開始在產(chǎn)品里部署基于深度學(xué)習(xí)的相關(guān)技術(shù)。
從早期基于 page Rank 的搜索技術(shù)到引入知識圖譜以及全面整合深度學(xué)習(xí),Google 一遍遍地將互聯(lián)網(wǎng)上的原始信息、基于 Android 系統(tǒng)收集到信息、利用Google 服務(wù)( 搜索、Gmail、Youtube)搜集的信息清洗、過濾、重組,寄希望于從這些「0和1」的組合里找到智能的存在方式。
2014 年 10月,Google 推出 Gmail 的「進(jìn)化版」—— Inbox,這是一個基于對郵件自動掃描后的重新展示,自 Inbox 的幫助下,用戶收件箱里的郵件可以自動被歸類到「旅行」(如機(jī)票郵件)、「財務(wù)」(如信用卡賬單)、新聞資訊(如各種網(wǎng)站的訂閱) 。2015 年的 Google I/O 大會發(fā)布的 Google Photo 令人震驚。Google 開辟了對于照片處理的新方式,基于深度學(xué)習(xí)的算法,Google Photo 可以自動識別、分類,并支持自然語言搜索。
Google :把雞蛋放在多個籃筐
直到 2015 年夏天 Google 宣布重組,或許很多人還沒有意識到這家公司的業(yè)務(wù)有多繁雜,在新的 Alphabet 架構(gòu)下,新 Google 聚焦在在線業(yè)務(wù)和 Android 產(chǎn)品線以及云服務(wù)。尤其是在 Google 商業(yè)模式即將轉(zhuǎn)型的大背景下,人工智能或許將出現(xiàn)在更多的 Google 產(chǎn)品里。
長期以來,Google 的盈利渠道都是廣告。在今年 4 月財報電話會議上,Google CEO 桑達(dá)爾·皮查伊公開表示:Google 將加快云計算業(yè)務(wù)發(fā)展,并計劃在 2020 年使云計算業(yè)務(wù)超過廣告業(yè)務(wù)。就在皮查伊上述表態(tài)的前后,Google 云計算服務(wù)簽下了Netflix、Spotify 這樣代表未來的企業(yè)級大客戶;并挖來曾一手打造 VMware 的 Diane Greene 來統(tǒng)領(lǐng)云計算團(tuán)隊(duì)。
2016 年 7 月的騰訊「云+未來」大會上,馬化騰這樣定義未來:「未來互聯(lián)網(wǎng)行業(yè)就是利用人工智能在云端處理大數(shù)據(jù)?!惯@實(shí)際上也是Google 在做的事情。皮查伊的這一幅手牌就是 Google 構(gòu)建的云計算生態(tài)。今年的Google Next 云計算大會上,Google發(fā)布了面向開發(fā)者的新機(jī)器學(xué)習(xí)平臺,并開放語音識別API等等,如果再加上去年推出的 TensorFlow 平臺,Google希望通過將這些人工智能的服務(wù)模塊化、開放化,讓云計算的PaaS 層、IaaS 層的服務(wù)都具備人工智能屬性,從而能夠快速完成數(shù)據(jù)處理。
DeepMind 則是 Google 的另一個秘密武器。日前,Google 宣布在數(shù)據(jù)中心的節(jié)能方案中采用 DeepMind 的算法,效果顯著。根據(jù)官方的數(shù)據(jù)顯示,這項(xiàng)技術(shù)幫助該公司將電力使用效率(PUE)提升了15%,與使用效率提升同時帶來的則是耗電量的下降,如果能將數(shù)據(jù)中心的耗電量降低10%,便有可能在幾年時間內(nèi)為 Google 節(jié)約數(shù)億美元電費(fèi)。而進(jìn)一步來看,倘若 Google 能在數(shù)據(jù)中心節(jié)能方面不斷優(yōu)化,其云計算的價格極有可能繼續(xù)下降,在云計算服務(wù)目前還處在價格敏感階段的時候,Google 的想象力還很大。
總結(jié)
上世紀(jì) 60 年代,包括約翰·麥肯錫、馬文·明斯基在內(nèi)的人工智能先驅(qū)們堅信,只需十年時間就足以制造一種可以匹及人類智能的智能。后來的故事大家或許都知道了,半個多世紀(jì)的時間,人工智能在寒冬與初春的交替中緩慢前行。現(xiàn)在,在算法逐步成熟、數(shù)據(jù)量增加以及計算能力突飛猛進(jìn)的幫助下,我們或?qū)⒂行乙娮C一次最接近人類智能的智能。
與過往不同,這一次的智能誕生在每個人的手里緊緊握著的智能手機(jī)。本文并沒有去對比其他互聯(lián)網(wǎng)巨頭,包括微軟、亞馬遜、Facebook 以及中國 BAT 的布局和思路,但無一例外,你能感受的這些智能都或多或少地在你的指尖呈現(xiàn)。
從計算普及到交互進(jìn)化,蘋果和 Google 在兩條不同的道路上快速前進(jìn),相比來說,包括微軟、亞馬遜、Facebook 在內(nèi)的人工智能計劃都與 Google 類似,而堅守「隱私價值觀」與「設(shè)備智能」 的蘋果,似乎并沒有同盟者……雖說殊途同歸,但觀察以及見證他們的行進(jìn)故事,也頗具意義。