來(lái)源:數(shù)據(jù)派THU 時(shí)間:2018-09-13 13:17:58 作者:劉運(yùn)渠
本講座選自清華-青島數(shù)據(jù)科學(xué)研究院大數(shù)據(jù)基礎(chǔ)設(shè)施研究中心特聘研究員劉運(yùn)渠9月5日在Odaily星球日?qǐng)?bào) X 36Kr P.O.D大會(huì)上所做的題為《下一代數(shù)據(jù)網(wǎng):數(shù)據(jù)驅(qū)動(dòng)的云網(wǎng)鏈一體化》的演講。
以下為演講視頻,建議在wifi環(huán)境下觀看
▼
以下是演講圖文實(shí)錄
▼
劉運(yùn)渠:數(shù)據(jù)驅(qū)動(dòng)的云網(wǎng)鏈一體化,它潛在的商業(yè)場(chǎng)景,是把它作為一個(gè)基礎(chǔ)設(shè)施來(lái)提供。清華-青島數(shù)據(jù)科學(xué)研究院是一個(gè)多學(xué)科的交叉融合,與數(shù)據(jù)確權(quán)和安全多方計(jì)算的核心技術(shù),來(lái)建立的數(shù)據(jù)分享平臺(tái)。它的目標(biāo)是實(shí)現(xiàn)一個(gè)大數(shù)據(jù)自來(lái)水管道,做到一些資產(chǎn)服務(wù)和創(chuàng)新技術(shù),最重要的目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)。
現(xiàn)有的三大核心技術(shù)云、網(wǎng)、鏈各自有一些缺點(diǎn)。數(shù)據(jù)協(xié)議方面,有數(shù)據(jù)孤島的問(wèn)題,成本和靈活性的問(wèn)題及數(shù)據(jù)確權(quán)和效率的問(wèn)題,這是清華大學(xué)下一代數(shù)據(jù)網(wǎng)絡(luò)試圖解決的問(wèn)題,最主要的方法是通過(guò)區(qū)塊鏈技術(shù)的研究和產(chǎn)業(yè)化方面來(lái)做一些動(dòng)作。
剛剛講了一些機(jī)構(gòu)性的介紹,下面會(huì)深入到技術(shù)和產(chǎn)業(yè)細(xì)節(jié)里面去。
什么是這三大塊融為一體化,這是一個(gè)很大的野心。
我們能不能占一個(gè)萬(wàn)米的高空,看這三大技術(shù)的關(guān)系呢?我們看到機(jī)器學(xué)習(xí)的AI,它得益于大數(shù)據(jù),同時(shí)它又為大數(shù)據(jù)提供了一個(gè)得力的工具。云計(jì)算,跟邊緣計(jì)算、霧計(jì)算一起,在不同的場(chǎng)景,有不同的需求。對(duì)于云計(jì)算來(lái)講,大的數(shù)據(jù)在需要計(jì)算力方面有一個(gè)彈性。當(dāng)我需要算力的時(shí)候,我希望無(wú)窮大;當(dāng)我不需要算力的時(shí)候,手機(jī)的CPU是閑著的,所以這是計(jì)算力共享的問(wèn)題。
基礎(chǔ)設(shè)施試圖轉(zhuǎn)向以數(shù)據(jù)為中心的場(chǎng)景,大家已經(jīng)比較熟悉一些CDN、NDN、ICN、DCN,本質(zhì)是把網(wǎng)絡(luò)從比特流轉(zhuǎn)向數(shù)據(jù)。我們認(rèn)為未來(lái)的價(jià)值焦點(diǎn),也就是從大數(shù)據(jù)視角來(lái)看,它不僅僅是數(shù)據(jù)隱私的問(wèn)題,首先是數(shù)據(jù)的所有權(quán)。數(shù)據(jù)的隱私,首先數(shù)據(jù)是我的,你憑什么拿去用,拿去用有沒(méi)有好處,這個(gè)好處是不是我應(yīng)該得到。這才是我們認(rèn)為下一階段大數(shù)據(jù)的核心問(wèn)題。
從剛剛講的大數(shù)據(jù)和網(wǎng)絡(luò)視角下,我們?cè)倏磪^(qū)塊鏈?zhǔn)鞘裁辞闆r。
首先,我們認(rèn)為區(qū)塊鏈技術(shù)可能具有實(shí)現(xiàn)數(shù)據(jù)確權(quán)的潛力。這里引用一下谷歌董事長(zhǎng)斯密特的說(shuō)法,他認(rèn)為區(qū)塊鏈技術(shù)最大的價(jià)值,就是實(shí)現(xiàn)的數(shù)據(jù)的稀缺性,也就是不可以篡改和隨便拷貝。為什么稀缺性很重要?因?yàn)樗嵌麻L(zhǎng),他關(guān)心經(jīng)濟(jì)問(wèn)題,沒(méi)有稀缺性就沒(méi)有經(jīng)濟(jì)價(jià)值。
第二,我們認(rèn)為區(qū)塊鏈技術(shù)跟大數(shù)據(jù)的結(jié)合,可能會(huì)出現(xiàn)萬(wàn)億級(jí)的商業(yè)。
第三,區(qū)塊鏈技術(shù)尚未具有支撐大數(shù)據(jù)的能力,這是我們下一代數(shù)據(jù)網(wǎng)要解決的核心難題。
第四,區(qū)塊鏈對(duì)于網(wǎng)絡(luò)本身也提出了巨大挑戰(zhàn)。區(qū)塊鏈在技術(shù)上有三大塊,一個(gè)是分布式共識(shí),一個(gè)是加密,一個(gè)是基于P2P的廣播。P2P的廣播是廣播的一種,是基于點(diǎn)對(duì)點(diǎn)實(shí)現(xiàn)的。廣播對(duì)于網(wǎng)絡(luò)來(lái)講是很可怕的東西,因?yàn)镹到N遠(yuǎn)遠(yuǎn)大于1到1的量。如果有一個(gè)網(wǎng)絡(luò)可以支撐完美的通信的話,它需要什么呢?它需要網(wǎng)絡(luò)的有效載荷即有效排列組合可以達(dá)到N的N次方,而普通網(wǎng)絡(luò)只有達(dá)到N的階層數(shù)字,這兩個(gè)數(shù)字差距非常的大。我們認(rèn)為網(wǎng)絡(luò)是區(qū)塊鏈規(guī)模應(yīng)用的瓶頸之一,一方面它的商業(yè)價(jià)值備受關(guān)注,另一方面它的規(guī)模和實(shí)驗(yàn),成為關(guān)注的焦點(diǎn)。
今天有很多嘉賓在規(guī)模方面講得比較多,我集中精力講一下時(shí)延的問(wèn)題。
第一,關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)是非常強(qiáng)悍的,它可以輕松達(dá)到千萬(wàn)次的TPS?,F(xiàn)有的系統(tǒng),不要上千萬(wàn)次,幾千次都不是那么容易的事。成熟的系統(tǒng)需求也沒(méi)有那么高,日常也就是2000次。沒(méi)有必要在這塊做無(wú)謂的追求,這方面我們趕不過(guò)關(guān)系型數(shù)據(jù)庫(kù)。
第二,交易的時(shí)延和帶寬是不一樣的東西。比如我烤匹薩10個(gè)小時(shí),同時(shí)烤了10塊匹薩,我回頭跟人說(shuō),10個(gè)小時(shí)烤了10個(gè)披薩,平均時(shí)間1小時(shí)。這里面是有誤導(dǎo)的。時(shí)延就是說(shuō),到底烤一塊匹薩多久,這對(duì)于實(shí)際應(yīng)用很有價(jià)值。我們來(lái)看看它受到什么限制呢?一些是我們看得見(jiàn)的,就是代碼里面可以看到,就是顯示限制,比如交易尺寸、快、平均大小。當(dāng)像中本聰這樣世界級(jí)的設(shè)計(jì)者,他們?cè)O(shè)計(jì)的時(shí)候,是考慮后面的限制。算法現(xiàn)在的研究可以達(dá)到100毫秒以下,我們網(wǎng)絡(luò)也做到100毫秒以下,1+1等于200毫秒,再給以3倍的安全系數(shù),目標(biāo)可以到600毫秒。由于廣播的模型,會(huì)導(dǎo)致它的規(guī)模也不會(huì)很大,所以要解決這個(gè)問(wèn)題,可能要通過(guò)一些分集,用聯(lián)盟鏈的方法來(lái)處理。
下一代的數(shù)據(jù)網(wǎng)絡(luò),它可以支持高速、海量區(qū)塊鏈吞吐。首先在廣域里面部署一個(gè)服務(wù),同時(shí)能夠支持毫秒級(jí)、亞秒級(jí)的交易,能夠?qū)崿F(xiàn)規(guī)?;膮^(qū)塊鏈應(yīng)用。為什么呢?因?yàn)槲覀冊(cè)趶V播里面增加廣播代理,不要每個(gè)人都去廣播,這就是聯(lián)盟鏈的觀點(diǎn)。
這一塊清華大學(xué)希望我們能夠提供一些區(qū)塊鏈設(shè)施、平臺(tái)以及應(yīng)用作為服務(wù)。而且區(qū)塊鏈在阿爾山的基礎(chǔ)區(qū)塊鏈項(xiàng)目里面已經(jīng)做了這樣的場(chǎng)景。這是清華區(qū)塊鏈現(xiàn)有的下一代數(shù)據(jù)網(wǎng)的設(shè)計(jì)方案及想要實(shí)現(xiàn)的目標(biāo)。
責(zé)任編輯:方茶云