第二層:數(shù)據(jù)工廠
作為一個(gè)人,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫面,某個(gè)音樂等等就能記起很多事情,比如當(dāng)你聽老歌時(shí),看到童年的玩具時(shí),洶涌的記憶總會(huì)被調(diào)出來。當(dāng)然這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問過去,機(jī)器沒有分類的概念,就像在圖書館中,機(jī)器是一個(gè)不會(huì)看分類的管理員,他要找某一本書時(shí)只能一本一本的找過去,十分笨拙。
也就是說,機(jī)器要想搜索什么內(nèi)容時(shí),必須有人來幫助它建立起分類,但最矛盾的就是,在錯(cuò)綜復(fù)雜的語言結(jié)構(gòu)中,我們很難為一個(gè)詞去下定義,比如當(dāng)你在說“蘋果”這個(gè)詞的時(shí)候,你如何告訴機(jī)器他的分類?"蘋果"究竟是一個(gè)名詞,還是一個(gè)公司?而決定一個(gè)詞的意義的則是語境,也就是機(jī)器要依靠其他詞語的出現(xiàn)來為這個(gè)詞做模糊的定義,不能完全給它下死定義而是要根據(jù)環(huán)境來下,并且它還應(yīng)當(dāng)是動(dòng)態(tài)的,不斷變化的。
也就是說這種搜索技術(shù)也依然要百度的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫,而這個(gè)庫中的每一個(gè)詞又都各自構(gòu)成庫,百度的數(shù)據(jù)工廠所創(chuàng)造的算法,就是在這么一個(gè)數(shù)據(jù)之海中去為他們建立管理,然后去索引。
數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過程。
第三層:百度大腦
人腦有了記憶,有了關(guān)聯(lián)之后就會(huì)進(jìn)行決策,比如小孩子碰到開水,燙到了手下次就不會(huì)碰,就是因?yàn)橛洃浟碎_水和燙手的痛苦,并將這兩個(gè)記憶關(guān)聯(lián)在了一起,才有了下次不去碰開水的決策。而百度大腦就是在模仿這些行為,做記憶關(guān)聯(lián)之后的決策、行動(dòng)、創(chuàng)造。
我之前關(guān)于開放云和數(shù)據(jù)工廠的分析完全是建立在搜索引擎之上,只是站在了百度對(duì)漢語能力的理解而已,而那時(shí)百度的人工智能也確實(shí)只是剛出生的嬰兒而已,只能在PC端爬行,但是當(dāng)智能手機(jī)誕生,可穿戴智能設(shè)備的出現(xiàn)后,百度開始成為可以走路的嬰兒,此時(shí)百度大腦的智力已是高達(dá)兩歲的嬰兒水平。
從搜索引擎智能到硬件智能,這是一個(gè)平面到立體,二維到三維的過程。原因是以前百度搜集到的數(shù)據(jù)只能夠是PC端用戶的搜索行為,這之中充其量只有文字內(nèi)容罷了,百度所能夠建立的僅僅只是語言理解,對(duì)用戶的輸入文字?jǐn)?shù)據(jù)做不斷的處理與反饋,但是到了手機(jī)端,智能硬件端則完全變天,百度可以收集到的不僅僅只會(huì)是語言數(shù)據(jù),更會(huì)收集到一整套的使用場(chǎng)景數(shù)據(jù)!
此時(shí),百度從為用戶提供搜索結(jié)果的搜索引擎開始轉(zhuǎn)變?yōu)橄蛴脩籼峁┤轿唤鉀Q方案的人工智能,想象力無窮。