來(lái)源:亞信數(shù)據(jù) 時(shí)間:2017-03-03 14:06:55 作者:方亮
?上篇說(shuō)了區(qū)塊鏈與大數(shù)據(jù)之間的一些相同點(diǎn),這篇我們來(lái)談?wù)剝烧咧g的一些不同點(diǎn)。
?點(diǎn)擊查看:大數(shù)據(jù)和區(qū)塊鏈之異同【上篇】
?大數(shù)據(jù)和區(qū)塊鏈技術(shù)之異
?兩者屬于不同的時(shí)代,區(qū)塊鏈繼大數(shù)據(jù)之后的又一次技術(shù)革命。
?兩個(gè)技術(shù)處于不同的生命周期
?——Gartner Hype Cycle
?技術(shù)成熟度曲線(The Hype Cycle)是咨詢公司Gartner用來(lái)分析和預(yù)測(cè)各種新科技的成熟演變速度及所需時(shí)間著名工具。
?“大數(shù)據(jù)”與“區(qū)塊鏈”在Gartner歷年的《技術(shù)成熟度曲線》中的出現(xiàn)情況
?2011年,“大數(shù)據(jù)”第一次上榜,位于技術(shù)萌芽期的爬坡階段,當(dāng)時(shí)還統(tǒng)稱為“‘Big Data’ and Extreme Information Processing and Management”(“大數(shù)據(jù)”和極端信息處理和管理)。2012年更進(jìn)一步,并在2013年幾乎達(dá)到了過(guò)熱期頂峰。經(jīng)歷了2014年的下滑,從2015年開始,“大數(shù)據(jù)”突然從曲線中消失,可解讀為Gartner對(duì)大數(shù)據(jù)的定位已從“新興”轉(zhuǎn)為“主流”。當(dāng)前,大數(shù)據(jù)對(duì)于企業(yè)的意義已從能力要素上升為戰(zhàn)略核心。
?相對(duì)而言,“區(qū)塊鏈”直到2016年才第一次出現(xiàn)在《技術(shù)成熟度曲線》中,并直接進(jìn)入“過(guò)熱期”??偟膩?lái)看,“大數(shù)據(jù)”和“區(qū)塊鏈”所處的生命周期階段大不相同,兩者約有5年左右的差距。
?主要差異在哪?
?大數(shù)據(jù)通常用來(lái)描述數(shù)據(jù)集足夠大,足夠復(fù)雜,以致很難用傳統(tǒng)的方式來(lái)處理。而區(qū)塊鏈能承載的信息數(shù)據(jù)是有限的,離“大數(shù)據(jù)”標(biāo)準(zhǔn)還差得很遠(yuǎn)。區(qū)塊鏈與大數(shù)據(jù)有幾個(gè)顯著差異:
?結(jié)構(gòu)化vs非結(jié)構(gòu)化:區(qū)塊鏈?zhǔn)墙Y(jié)構(gòu)定義嚴(yán)謹(jǐn)?shù)膲K,通過(guò)指針組成的鏈,典型的結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)需要處理的更多的是非結(jié)構(gòu)化數(shù)據(jù);
?獨(dú)立vs整合:區(qū)塊鏈系統(tǒng)為保證安全性,信息是相對(duì)獨(dú)立的,而大數(shù)據(jù)著重的是信息的整合分析;
?直接vs間接:區(qū)塊鏈系統(tǒng)本身就是一個(gè)數(shù)據(jù)庫(kù),而大數(shù)據(jù)指的是對(duì)數(shù)據(jù)的深度分析和挖掘,是一種間接的數(shù)據(jù);
?數(shù)學(xué)vs數(shù)據(jù):區(qū)塊鏈試圖用數(shù)學(xué)說(shuō)話,區(qū)塊鏈主張“代碼即法律”,而大數(shù)據(jù)試圖用數(shù)據(jù)說(shuō)話;
?匿名vs個(gè)性:區(qū)塊鏈?zhǔn)悄涿模ü_賬本,匿名擁有者,相對(duì)于傳統(tǒng)金融機(jī)構(gòu)的公開賬號(hào),賬本保密),而大數(shù)據(jù)有意的是個(gè)性化;
?差異能否調(diào)和?
?對(duì)一個(gè)分布式系統(tǒng)來(lái)說(shuō),存在CAP定理(CAP theorem)又被稱作布魯爾定理(Brewer's theorem),它指出一個(gè)分布式系統(tǒng)不可能同時(shí)滿足以下三點(diǎn):
?一致性(Consistence):在分布式系統(tǒng)中的所有數(shù)據(jù)備份,在同一時(shí)刻是否同樣的值。
?可用性(Availability):在集群中一部分節(jié)點(diǎn)故障后,集群整體是否還能響應(yīng)客戶端的讀寫請(qǐng)求。
?分區(qū)容忍性(Partition tolerance):集群中的某些節(jié)點(diǎn)在無(wú)法聯(lián)系后,集群整體是否還能繼續(xù)進(jìn)行服務(wù)。
?由于當(dāng)前的網(wǎng)絡(luò)硬件肯定會(huì)出現(xiàn)延遲丟包等問(wèn)題,所以分區(qū)容忍性是我們必須需要實(shí)現(xiàn)的。換句話說(shuō),CAP定理表明我們必須在一致性(C)和可用性(A)之間進(jìn)行權(quán)衡。
?具體到區(qū)塊鏈和大數(shù)據(jù)來(lái)說(shuō),大數(shù)據(jù)是以犧牲一致性(C)來(lái)?yè)Q取可用性(A)和分區(qū)容忍性(P)的,而區(qū)塊鏈卻優(yōu)先保證了一致性(C)。
?可相互借鑒之處
?通過(guò)CAP定理,我們知道區(qū)塊鏈和大數(shù)據(jù)的諸多特性無(wú)法兩全,需要針對(duì)具體場(chǎng)景,在多樣化的取舍方案下設(shè)計(jì)出多樣化的系統(tǒng)。
?區(qū)塊鏈+大數(shù)據(jù):在區(qū)塊鏈中使用大數(shù)據(jù)技術(shù)
?區(qū)塊鏈?zhǔn)且环N不可篡改的、全歷史的分布式數(shù)據(jù)庫(kù)存儲(chǔ)技術(shù),巨大的區(qū)塊鏈數(shù)據(jù)集合包含著每一筆交易的全部歷史,隨著區(qū)塊鏈技術(shù)的應(yīng)用迅速發(fā)展,數(shù)據(jù)規(guī)模會(huì)越來(lái)越大,不同業(yè)務(wù)場(chǎng)景區(qū)塊鏈的數(shù)據(jù)融合會(huì)進(jìn)一步擴(kuò)大數(shù)據(jù)規(guī)模和豐富性。
?區(qū)塊鏈以其可信任性、安全性和不可篡改性,讓更多數(shù)據(jù)被解放出來(lái),推進(jìn)數(shù)據(jù)的海量增長(zhǎng)。區(qū)塊鏈的可追溯性使得數(shù)據(jù)從采集、交易、流通,以及計(jì)算分析的每一步記錄都可以留存在區(qū)塊鏈上,使得數(shù)據(jù)的質(zhì)量獲得前所未有的強(qiáng)信任背書,也保證了數(shù)據(jù)分析結(jié)果的正確性和數(shù)據(jù)挖掘的效果。
?區(qū)塊鏈能夠進(jìn)一步規(guī)范數(shù)據(jù)的使用,精細(xì)化授權(quán)范圍。脫敏后的數(shù)據(jù)交易流通,則有利于突破信息孤島,建立數(shù)據(jù)橫向流通機(jī)制,形成“社會(huì)化大數(shù)據(jù)”?;趨^(qū)塊鏈的價(jià)值轉(zhuǎn)移網(wǎng)絡(luò),逐步推動(dòng)形成基于全球化的數(shù)據(jù)交易場(chǎng)景。
?區(qū)塊鏈提供的是賬本的完整性,數(shù)據(jù)統(tǒng)計(jì)分析的能力較弱。大數(shù)據(jù)則具備海量數(shù)據(jù)存儲(chǔ)技術(shù)和靈活高效的分析技術(shù),極大提升區(qū)塊鏈數(shù)據(jù)的價(jià)值和使用空間。
?大數(shù)據(jù)+區(qū)塊鏈:在大數(shù)據(jù)中使用區(qū)塊鏈技術(shù)
?大數(shù)據(jù)的技術(shù)生態(tài)百花齊放,沒(méi)有哪個(gè)軟件能解決所有的問(wèn)題,能解決問(wèn)題也是在一個(gè)范圍內(nèi),即使是Spark、Flink等。在強(qiáng)調(diào)透明性、安全性的場(chǎng)景下,區(qū)塊鏈有其用武之地。在大數(shù)據(jù)的系統(tǒng)上使用區(qū)塊鏈技術(shù),可以使得數(shù)據(jù)不能被隨意添加、修改和刪除,當(dāng)然其時(shí)間和數(shù)據(jù)量級(jí)是有限度的。
?以時(shí)間、數(shù)據(jù)量為坐標(biāo)軸,列出了目前大數(shù)據(jù)引擎大致擅長(zhǎng)處理數(shù)據(jù)的范圍,區(qū)塊鏈可在其中成為一種很好的補(bǔ)充
?比如,對(duì)于存檔的歷史數(shù)據(jù),因?yàn)樗鼈兪遣荒鼙恍薷牡?,我們可以?duì)大數(shù)據(jù)作Hash處理,并加上時(shí)間戳,存在區(qū)塊鏈之上。在未來(lái)的某一時(shí)刻,當(dāng)我們需要驗(yàn)證原始數(shù)據(jù)地真實(shí)性時(shí),可以對(duì)對(duì)應(yīng)的數(shù)據(jù)做同樣的Hash處理,如果得出的答案是相同的,則說(shuō)明數(shù)據(jù)是沒(méi)有被篡改過(guò)的?;蛘撸粚?duì)匯總數(shù)據(jù)和結(jié)果做處理,這樣,只需要處理增量數(shù)據(jù)處理,那么應(yīng)對(duì)的數(shù)據(jù)量級(jí)和吞吐量級(jí)可能是今天的區(qū)塊鏈或改善過(guò)的系統(tǒng)可以處理的。
?通過(guò)把大數(shù)據(jù)與區(qū)塊鏈相結(jié)合,能讓區(qū)塊鏈中的數(shù)據(jù)更有價(jià)值,也能讓大數(shù)據(jù)的預(yù)測(cè)分析落實(shí)為行動(dòng),它們都將是數(shù)字經(jīng)濟(jì)時(shí)代的基石。
?
責(zé)任編輯:陳近梅