來(lái)源:百分點(diǎn) 時(shí)間:2017-07-04 16:11:51 作者:
我們已經(jīng)處在技術(shù)復(fù)興的時(shí)代,伴隨數(shù)據(jù)量爆發(fā)、大數(shù)據(jù)技術(shù)發(fā)展以及GPGPU等高性能計(jì)算硬件的成熟運(yùn)用,讓人工智能技術(shù)在經(jīng)歷多年的不溫不火后,重新吸引了大眾的眼球。本輪人工智能的關(guān)注熱點(diǎn),主要集中在機(jī)器視覺(jué)、機(jī)器聽(tīng)覺(jué)、自動(dòng)駕駛、機(jī)器人等看起來(lái)更加“貼近自然”的領(lǐng)域上。事實(shí)上,以機(jī)器學(xué)習(xí)、自然語(yǔ)言處理為代表的一系列人工智能技術(shù)早已在互聯(lián)網(wǎng)領(lǐng)域運(yùn)用多年,并取得了輝煌的商業(yè)成果。
當(dāng)前,雖然人工智能得到了資本的大力追捧,但真正大規(guī)模運(yùn)用且成功的應(yīng)用仍然集中在精準(zhǔn)營(yíng)銷、個(gè)性化推薦等互聯(lián)網(wǎng)場(chǎng)景中。而新一代的身份認(rèn)證、語(yǔ)音助手、客服機(jī)器人、自動(dòng)駕駛等人工智能應(yīng)用才剛剛起步,離“叫好叫座”尚有不少的距離,甚至我們還不清楚它們是否真能帶來(lái)巨大的商業(yè)回報(bào)。那么,下一步人工智能往何處發(fā)展?是否這一波熱潮過(guò)去后又會(huì)歸于平靜,重回學(xué)術(shù)界的研究?
百分點(diǎn)集團(tuán)技術(shù)副總裁兼首席架構(gòu)師劉譯璟認(rèn)為,當(dāng)前的人工智能技術(shù)還只能在較窄的場(chǎng)景下應(yīng)用,要想更好的解決現(xiàn)實(shí)問(wèn)題,人工智能還需要在理論、技術(shù)和數(shù)據(jù)上進(jìn)行大的突破。未來(lái)的技術(shù)重點(diǎn)將集中在如下一些領(lǐng)域。
一、多種建模方式相結(jié)合
傳統(tǒng)的人工智能實(shí)現(xiàn)方式,往往是由各個(gè)終端將數(shù)據(jù)匯總到云端,而后在云端進(jìn)行集中式的建模,并以SaaS方式對(duì)外提供服務(wù)。之所以采取這樣的方式是因?yàn)橹挥性谠贫瞬拍芗写罅康挠?jì)算資源,進(jìn)行復(fù)雜的建模和推理。但這種建模方式存在很大的問(wèn)題:一是其應(yīng)用對(duì)網(wǎng)絡(luò)環(huán)境的要求極高,例如Siri一旦連不上網(wǎng)絡(luò)就完全無(wú)法使用了;二是很難做到實(shí)時(shí)響應(yīng),這對(duì)于像自動(dòng)駕駛之類的應(yīng)用場(chǎng)景來(lái)說(shuō)是致命的;第三,數(shù)據(jù)匯總到云端還存在隱私泄漏、數(shù)據(jù)安全等一法律和道德問(wèn)題,增加行業(yè)潛在風(fēng)險(xiǎn)。從另外一個(gè)角度來(lái)看,云端集中建模的方式也比較低效,這是因?yàn)楦鱾€(gè)終端所面對(duì)的環(huán)境是千差萬(wàn)別的,反映在數(shù)據(jù)層面就是各個(gè)終端的數(shù)據(jù)個(gè)性十足,將這些個(gè)性十足的數(shù)據(jù)匯總到云端再統(tǒng)一處理,顯然不如在各個(gè)終端先進(jìn)行標(biāo)準(zhǔn)化再交給云端建模效率高。這種理念,特別類似于我們?cè)赟QL優(yōu)化中先執(zhí)行WHERE再進(jìn)行JOIN。
解決上面問(wèn)題的思路,就是集中式建模(云計(jì)算)+微建模(邊緣計(jì)算)的結(jié)合。邊緣計(jì)算可以對(duì)一些簡(jiǎn)單的問(wèn)題進(jìn)行自行處理并將處理后的結(jié)果傳輸給云端??梢哉f(shuō),邊緣計(jì)算是云計(jì)算的縮小加持版本,是靠近設(shè)備的小型數(shù)據(jù)中心。
邊緣計(jì)算也助推了物聯(lián)網(wǎng)的發(fā)展,物聯(lián)網(wǎng)的核心是讓每個(gè)物體智能連接、運(yùn)行,物聯(lián)網(wǎng)不止在改變?nèi)藗內(nèi)粘5纳盍?xí)慣,實(shí)際上,它更是在創(chuàng)造新的“生態(tài)”環(huán)境,借助邊緣計(jì)算,通過(guò)設(shè)備端的數(shù)據(jù)分析處理,就可實(shí)現(xiàn)物與物之間的傳感、交互和控制。
除此之外,因靠近設(shè)備,邊緣計(jì)算還解決了從網(wǎng)絡(luò)邊緣到云數(shù)據(jù)中心網(wǎng)絡(luò)帶寬、延時(shí)的限制,作為一種本地化的計(jì)算模式,邊緣計(jì)算提供了對(duì)于計(jì)算服務(wù)需求更快的響應(yīng)速度,而且通常情況下,它不將大量的原始數(shù)據(jù)發(fā)回核心網(wǎng),這使其在涉及個(gè)人隱私保護(hù)與數(shù)據(jù)安全方面的優(yōu)勢(shì)尤為明顯。并且,邊緣計(jì)算不需要主動(dòng)協(xié)助IaaS、PaaS、SaaS和其他云服務(wù),更多地專注于終端設(shè)備端,可以節(jié)省能耗。
我們看到Google也在推進(jìn)這種建模理念。Google近日推出一個(gè)專門(mén)針對(duì)移動(dòng)電話而優(yōu)化的Tensorflow版本:TensorflowLite,它允許開(kāi)發(fā)人員在用戶的移動(dòng)電話上實(shí)時(shí)地運(yùn)行人工智能應(yīng)用。利用TensoflowLite,我們能將一些人工智能的處理轉(zhuǎn)移到用戶的移動(dòng)電話端。這不僅可以節(jié)省處理能力,而且降低了數(shù)據(jù)量。此外,它同樣可確保用戶的數(shù)據(jù)的私有性,可不再依賴于因特網(wǎng)連接。
二、多種人工智能技術(shù)相融合
本次的人工智能熱潮,讓深度學(xué)習(xí)廣為人知,甚至許多人認(rèn)為深度學(xué)習(xí)可以包打天下,是實(shí)現(xiàn)人工智能的終極武器。這其實(shí)是一種相當(dāng)大的誤會(huì)!
我們知道深度學(xué)習(xí)本質(zhì)上是一種從數(shù)據(jù)中歸納規(guī)律的方法,它需要海量的樣本進(jìn)行訓(xùn)練,例如AlphaGO的自我對(duì)局,學(xué)習(xí)樣本越多,效果越好。而且,深度學(xué)習(xí)的層數(shù)越多、特征越多,需要的數(shù)據(jù)量就越大。但在真實(shí)的業(yè)務(wù)場(chǎng)景中,我們有這么多的數(shù)據(jù)嗎?例如圍棋、游戲這一類可以不斷重復(fù)的場(chǎng)景,我們有可能迅速積累數(shù)據(jù)。但現(xiàn)實(shí)中我們面對(duì)的是投資理財(cái)、商品交易、政府決策、災(zāi)害評(píng)估這些場(chǎng)景,這些場(chǎng)景下的數(shù)據(jù)往往少得可憐。即使我們能積累出足夠多的數(shù)據(jù),也是需要相當(dāng)長(zhǎng)的時(shí)間。因此,在這些場(chǎng)景下,深度學(xué)習(xí)無(wú)能為力。
另外,深度學(xué)習(xí)是一種端到端的學(xué)習(xí)方式,整個(gè)學(xué)習(xí)過(guò)程中不需要人的干預(yù)。直接把海量數(shù)據(jù)投放到算法中,讓數(shù)據(jù)自己說(shuō)話,系統(tǒng)會(huì)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)。從輸入到輸出是一個(gè)完全自動(dòng)的過(guò)程,這也造成了深度學(xué)習(xí)有自身的兩個(gè)局限:不可解釋和缺乏反饋機(jī)制。簡(jiǎn)單來(lái)說(shuō),我們既不知道模型學(xué)到了什么知識(shí),也無(wú)法將這些知識(shí)舉一反三到其他場(chǎng)合,我們還無(wú)法對(duì)學(xué)習(xí)到的知識(shí)進(jìn)行評(píng)估并優(yōu)化模型。事實(shí)上,深度學(xué)習(xí)的前身是人工神經(jīng)網(wǎng)絡(luò),它只是人工智能中連接主義派別的一種方法而已,遠(yuǎn)遠(yuǎn)達(dá)不到包打天下的程度。從1956年人工智能這個(gè)概念提出開(kāi)始,腦洞大開(kāi)的學(xué)者們相繼提出了三個(gè)研究學(xué)派,或者說(shuō)三類思潮、三類哲學(xué)思想,分別是:符號(hào)主義、連接主義和行為主義。
符號(hào)主義起源于數(shù)理邏輯。它認(rèn)為人的智能或者人的智慧、人的思維是一種理性的活動(dòng),我們可以研究清楚人的思維到底是如何運(yùn)作的,然后把它編碼到程序中實(shí)現(xiàn)智能。這一派的典型的技術(shù)就是知識(shí)表示、知識(shí)推理,以前的知識(shí)工程,專家系統(tǒng)等技術(shù)等都屬于這一派。簡(jiǎn)單來(lái)說(shuō)符號(hào)主義是研究并模擬人的思維方法,進(jìn)而打造一個(gè)像人那樣思維的機(jī)器。
連接主義受仿生學(xué)影響,期望通過(guò)模擬人腦的結(jié)構(gòu)實(shí)現(xiàn)智能。其中的典型代表就是人工神經(jīng)網(wǎng)絡(luò)。顧名思義,人工神經(jīng)網(wǎng)絡(luò)就是受到了人腦結(jié)構(gòu)(神經(jīng)元、突觸等)的啟發(fā),企圖從軟件和硬件角度去模擬神經(jīng)元以及神經(jīng)元之間的連接,讓這些軟件和硬件像人那樣“思考”。當(dāng)然,我們不難想象到,即使這些軟件和硬件真的“思考”了,我們也不知道它們到底是怎么思考的,是不是像人類一樣在思考,這也是這一派最被人詬病之所在,因?yàn)楫吘刮覀儧](méi)有搞清楚人類到底是如何思考的。簡(jiǎn)單來(lái)說(shuō),連接主義是研究并模擬人腦的物理結(jié)構(gòu),進(jìn)而打造一個(gè)擁有類似于人腦活動(dòng)的機(jī)器。
行為主義則起源于控制論,它認(rèn)為智能是一個(gè)生命體在和環(huán)境的不斷交互中習(xí)得的,是“進(jìn)化”而來(lái)的。例如,人類一開(kāi)始沒(méi)有什么智能,一無(wú)所知,但在與大自然的交互中,環(huán)境不斷的給人類反饋,告訴人類這樣的行為行不通、會(huì)碰壁、甚至?xí)斓?;而另外一些行為?huì)得到自然的饋贈(zèng),讓人類生活得更舒適。于是,人類在世世代代的生活中習(xí)得了“智慧”!行為主義的觀點(diǎn)是我們需要建設(shè)一種可以與環(huán)境交互的系統(tǒng),讓它進(jìn)化來(lái)獲得智能。這一派的典型技術(shù)是強(qiáng)化學(xué)習(xí),在反饋中不斷優(yōu)化模型的效果。簡(jiǎn)單來(lái)說(shuō),行為主義是研究并模擬人類與環(huán)境的交互,進(jìn)而打造一個(gè)可以自主地與環(huán)境交互的機(jī)器。
可以看出,這三個(gè)派別有著根本不同的哲學(xué)理念,發(fā)展出的技術(shù)也各有所長(zhǎng)。在人工智能的未來(lái)發(fā)展中,所有這些技術(shù)一定會(huì)有深度的融合。事實(shí)上,現(xiàn)在已經(jīng)看到了許多這樣的趨勢(shì),例如AlphaGo就是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合的例子,之所以能在圍棋上把人類完全擊倒,是因?yàn)樗讯说蕉说纳疃葘W(xué)習(xí)應(yīng)用在強(qiáng)化學(xué)習(xí)上,不僅通過(guò)完全的自學(xué)習(xí)、自我修煉、自我改正,從而不斷迭代,還能使得強(qiáng)化學(xué)習(xí)應(yīng)付大數(shù)據(jù)。另外一個(gè)例子是深度學(xué)習(xí)和遷移學(xué)習(xí)的結(jié)合。遷移學(xué)習(xí)能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,利用舊領(lǐng)域的知識(shí)更好地完成新領(lǐng)域的學(xué)習(xí)。遷移學(xué)習(xí)和深度學(xué)習(xí)的結(jié)合在一定程度上可以解決數(shù)據(jù)缺失和冷啟動(dòng)問(wèn)題。
三、知識(shí)工程和數(shù)據(jù)標(biāo)準(zhǔn)
上面提到了現(xiàn)實(shí)業(yè)務(wù)中我們往往無(wú)法獲得海量數(shù)據(jù),此時(shí)機(jī)器學(xué)習(xí)將面臨冷啟動(dòng)的問(wèn)題。解決冷啟動(dòng),很重要的一種思路是利用人們?cè)谠擃I(lǐng)域中已有的經(jīng)驗(yàn)和知識(shí),將這些知識(shí)“告知”計(jì)算機(jī),并讓它利用這些知識(shí)解決問(wèn)題。人工智能中的知識(shí)表示理論,就是這樣的初衷。它研究的是如何將人類的知識(shí)用計(jì)算機(jī)可以理解的語(yǔ)言表達(dá)出來(lái),以及如何讓計(jì)算機(jī)在這些知識(shí)上進(jìn)行推理,典型的技術(shù)包括本體、語(yǔ)義網(wǎng),以及最新的知識(shí)圖譜。
建設(shè)一個(gè)實(shí)用的知識(shí)圖譜并非易事,它首先需要人們將已有的知識(shí)清晰準(zhǔn)確的梳理出來(lái),而后用實(shí)體、屬性、關(guān)系等方式去描述,這期間涉及到大量業(yè)務(wù)專家和技術(shù)人員的工作,我們稱之為知識(shí)工程。但一旦建立好這樣的知識(shí)圖譜,將不僅對(duì)單個(gè)企業(yè),還將對(duì)整個(gè)行業(yè)、乃至整個(gè)世界都會(huì)帶來(lái)極大的價(jià)值。目前像Google、微軟這樣的巨頭已經(jīng)在紛紛建設(shè)自己的知識(shí)圖譜。
可以預(yù)料到,人工智能的進(jìn)一步發(fā)展一定會(huì)依賴于各行各業(yè)知識(shí)圖譜的建設(shè),否則人工智能終將停留在實(shí)驗(yàn)室而無(wú)法深入到真實(shí)業(yè)務(wù)中。因?yàn)闃I(yè)務(wù)中的歷史經(jīng)驗(yàn)和知識(shí)是萬(wàn)分寶貴的。在這許許多多知識(shí)工程的開(kāi)展過(guò)程中,我認(rèn)為人們會(huì)逐步形成行業(yè)甚至世界范圍內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)。從信息產(chǎn)業(yè)的發(fā)展歷程來(lái)看,我們經(jīng)歷了從五花八門(mén)的硬件規(guī)范到行業(yè)硬件標(biāo)準(zhǔn)建立的過(guò)程,我們正在經(jīng)歷五花八門(mén)的軟件規(guī)范到行業(yè)標(biāo)準(zhǔn)施行的過(guò)程,在數(shù)據(jù)標(biāo)準(zhǔn)建立上,我們也勢(shì)必會(huì)經(jīng)歷從行業(yè)標(biāo)準(zhǔn)的慢慢建立到逐漸推廣過(guò)程。一旦數(shù)據(jù)有了標(biāo)準(zhǔn),知識(shí)工程的開(kāi)展將簡(jiǎn)單許多,人工智能的應(yīng)用也將更加深入。
四、其他理論的學(xué)科的支持
人工智能是一門(mén)非常綜合的學(xué)科,它與哲學(xué)、數(shù)學(xué)、物理學(xué)、信息學(xué)、心理學(xué)和生命科學(xué)等密切相關(guān)。人工智能的進(jìn)一步發(fā)展也有賴于這些領(lǐng)域的進(jìn)步。目前來(lái)講,我們認(rèn)為量子計(jì)算將給人工智能帶來(lái)新的飛躍。這是因?yàn)?,一方面在理論上已?jīng)證明了量子算法可以極大的提高機(jī)器學(xué)習(xí)的效率,例如QSVM(量子支持向量機(jī))、QDL(量子深度學(xué)習(xí));另一方面,由于量子理論與意識(shí)之間微妙的關(guān)系,量子計(jì)算有可能會(huì)為人工智能帶來(lái)“意識(shí)”,那將可能是人工智能最激動(dòng)人心的一刻。
眼下,像IBM、Google、微軟這樣的巨頭早已開(kāi)始布局量子計(jì)算領(lǐng)域。D-Wave公司的量子退火機(jī),已經(jīng)在退火優(yōu)化算法上實(shí)現(xiàn)了數(shù)萬(wàn)倍的加速,這對(duì)人工智能來(lái)說(shuō)意義重大。毫不夸張地說(shuō),量子計(jì)算是人工智能的下一個(gè)期待。
最后,在人工智能幾起幾落之后,利用人工智能解決現(xiàn)實(shí)的問(wèn)題已成為迫切需求。針對(duì)眼下人工智能領(lǐng)域的創(chuàng)業(yè)和投資熱潮,我們認(rèn)為只有深入到行業(yè)中解決具體的問(wèn)題,才能讓企業(yè)真正立足。這就要求企業(yè)不能只是埋頭鉆研技術(shù),而必須抬頭看客戶鉆研業(yè)務(wù)需求,從一點(diǎn)一點(diǎn)的小事做起。只有企業(yè)持續(xù)不斷地創(chuàng)造價(jià)值,行業(yè)才有可能持續(xù)不斷地發(fā)展。
責(zé)任編輯:陳近梅