來源:數(shù)據(jù)觀 時間:2018-05-06 12:30:17 作者:魏凱
【編者按】大數(shù)據(jù)被稱為是未來發(fā)展的“新石油”,與實體經(jīng)濟融合發(fā)展是必經(jīng)之路。每年5月,在中國貴陽召開的中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(簡稱“數(shù)博會”)提供大平臺,集中展示最新技術及理論成果,齊聚行業(yè)相關人士共商大數(shù)據(jù)產(chǎn)業(yè)發(fā)展大計。在2018數(shù)博會即將召開之際,數(shù)據(jù)觀特別邀請行業(yè)專家、學者、企業(yè)家深入剖析產(chǎn)業(yè)發(fā)展現(xiàn)狀,推出系列大數(shù)據(jù)產(chǎn)業(yè)深度評論專欄《博言》。今天刊發(fā)的文章,是中國信息通信研究院云計算與大數(shù)據(jù)研究所主任魏凱撰寫的《大數(shù)據(jù)與實體經(jīng)濟融合的路徑》,分析了國內大數(shù)據(jù)產(chǎn)業(yè)的進展情況,并提出大數(shù)據(jù)應用發(fā)展待解決的問題。
大數(shù)據(jù)理念已經(jīng)深入人心,“用數(shù)據(jù)說話”的已經(jīng)成為所有人的共識,數(shù)據(jù)成了堪比石油、黃金、鉆石的戰(zhàn)略資源。人們對大數(shù)據(jù)的認識也更加具體化,數(shù)據(jù)無所謂大不大,有用最重要;數(shù)據(jù)是基礎,但分析挖掘和應用才是根本。
不僅對大數(shù)據(jù)的認識經(jīng)歷了螺旋上升,而且實踐逐漸落地,國內的大數(shù)據(jù)產(chǎn)業(yè)政策日漸完善,技術、應用和產(chǎn)業(yè)都取得了非常明顯的進展。
1.政策持續(xù)完善。在頂層設計上,國務院《促進大數(shù)據(jù)發(fā)展行動綱要》對政務數(shù)據(jù)共享開放、產(chǎn)業(yè)發(fā)展和安全三方面做了總體部署。數(shù)據(jù)開放共享方面的《政務信息資源共享管理暫行辦法》、產(chǎn)業(yè)方面的工信部《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020)》、數(shù)據(jù)安全方面的《中華人民共和國網(wǎng)絡安全法》等也都已出臺。衛(wèi)計、農業(yè)、檢察、稅務等部門還出臺了領域大數(shù)據(jù)發(fā)展的具體政策。此外,17個省市發(fā)布大數(shù)據(jù)發(fā)展規(guī)劃,十幾個省市設立了大數(shù)據(jù)管理局,8個國家大數(shù)據(jù)綜合試驗區(qū)、11個國家工程實驗室啟動建設??梢哉f,適應大數(shù)據(jù)發(fā)展的政策環(huán)境已經(jīng)初步形成。
2.技術穩(wěn)步提升。開源給國內產(chǎn)業(yè)界提供了一個跳板,讓我們與國際上大數(shù)據(jù)技術先進水平的差距在不斷縮小。2014-2016年,百度、阿里和騰訊先后拿下國際上知名的Sort Benchmark大賽冠軍。這個競賽全面比拼分布式系統(tǒng)軟件架構能力,包括如海量數(shù)據(jù)分布式存儲、計算任務切片調度、節(jié)點通信協(xié)調同步、數(shù)據(jù)計算監(jiān)控、硬件架構等方面的能力。而這一賽事2014年之前的冠軍均被微軟、Yahoo、亞馬遜等包攬。這從一個側面反映了我國產(chǎn)業(yè)界在大大數(shù)據(jù)處理技術水平的快速提升。與此同時,還有像一批國產(chǎn)化的商用大數(shù)據(jù)平臺產(chǎn)品崛起,底層技術越來越扎實。
3.應用逐漸落地。比如,在金融領域,2016年商業(yè)銀行全面部署大數(shù)據(jù)基礎設施,五大國有銀行、股份制、城商行和農商行已經(jīng)逐步開始了從傳統(tǒng)數(shù)據(jù)倉庫架構向大數(shù)據(jù)平臺架構的轉型改造過程,基于大數(shù)據(jù)風控的“秒貸”業(yè)務越來越普及,不僅提升了貸款效率,還擴大的普惠金融的覆蓋面。在電信領域,中國電信的大數(shù)據(jù)平臺已經(jīng)擴展到31個省,匯聚了全國的基礎數(shù)據(jù)形成了“天翼大數(shù)據(jù)”服務能力;中國聯(lián)通也實現(xiàn)了數(shù)據(jù)整合,大數(shù)據(jù)產(chǎn)品體系已經(jīng)推出征信、指數(shù)、營銷等六大產(chǎn)品種類。
4.產(chǎn)業(yè)快速崛起。圍繞數(shù)據(jù)的產(chǎn)生、匯聚、處理、應用等環(huán)節(jié)的產(chǎn)業(yè)生態(tài)從無到有,不斷壯大。中國信息通信研究院發(fā)布的《中國大數(shù)據(jù)產(chǎn)業(yè)調查報告(2017年)》顯示,2016年中國大數(shù)據(jù)核心產(chǎn)業(yè)(軟件、硬件及服務)的市場規(guī)模為168億元,較2015年增速達45%,預計到2020年將達到578億元。2016年獲得融資的企業(yè)數(shù)量達到400多家,2017年前三個月就有150多家企業(yè)獲得融資,其中半數(shù)為中國公司,資本源源不斷的投向大數(shù)據(jù)領域。
大數(shù)據(jù),代表了一種現(xiàn)象,即:數(shù)據(jù)的指數(shù)增長超過了人們管理、處理和應用數(shù)據(jù)的能力的增長,產(chǎn)生了一個“剪刀差”,而且這個“剪刀差”無疑將長期存在。無論是對一個國家還是一個企業(yè),誰能在縮小大數(shù)據(jù)剪刀差上拔得頭籌,把數(shù)據(jù)用好,就能占有競爭優(yōu)勢。
發(fā)展大數(shù)據(jù)前景還很廣闊,還有很多問題(機遇)等著解決(捕獲),比如:
1.打破數(shù)據(jù)孤島。人人都想要別人的數(shù)據(jù),但都不愿意把自己的數(shù)據(jù)給別人,這是人的天性。以前信息系統(tǒng)建設都從一個個“煙囪”開始,數(shù)據(jù)缺乏互通的技術基礎,這卻是“人禍”。從國家層面到企業(yè)內部,情況大同小異。麥肯錫2016年底的一份報告顯示,大數(shù)據(jù)在很多領域沒有達到預期效果,很重要的原因就是數(shù)據(jù)割裂。這些年,推動數(shù)據(jù)開放共享的政策舉措在一直在加強,政策已經(jīng)很給力了,但效果與預期相差甚遠,碰到了瓶頸。開放共享政策再往前“推”,仿佛遇到一堵高高的墻,這時就需要技術“拉”一把。的確,這些年數(shù)據(jù)共享技術供應有些滯后了。
未來,如果同態(tài)加密(homomorphic encryption)、差分隱私(differential privacy)、多方安全計算(secure multi-party computation)、零知識證明(zero-knowledge proof)等技術能取得突破,數(shù)據(jù)共享就能再前進一大步。區(qū)塊鏈的共享賬本、集體維護、難以篡改特性,也有望能助推數(shù)據(jù)共享。
2.數(shù)據(jù)資產(chǎn)管理。數(shù)據(jù)分析工作,往往有80%的時間和精力都耗費在搜集、清洗和加工數(shù)據(jù)上。數(shù)據(jù)質量不過關,也會讓數(shù)據(jù)分析效果大打折扣,甚至讓分析結果謬以千里。很多單位大數(shù)據(jù)應用效果不佳,多半問題出在數(shù)據(jù)管理上。大家都同意把數(shù)據(jù)當做資產(chǎn),甚至認為有朝一日數(shù)據(jù)會計入資產(chǎn)負債表。但如果對比桌椅板凳這些實物資產(chǎn),我們對數(shù)據(jù)資產(chǎn)的管理,還處于非常原始的階段。我們往往對自己的數(shù)據(jù)資產(chǎn)有哪些、有多少都不兩眼一抹黑,更別說數(shù)據(jù)質量、數(shù)據(jù)安全、資產(chǎn)評估、資產(chǎn)交換交易等精細管理、價值挖掘和持續(xù)運營了。
然而,數(shù)據(jù)資產(chǎn)管理不像數(shù)據(jù)分析挖掘那么光鮮亮麗,就像城市的“下水道工程”,短期只有投入看不見產(chǎn)出。但長期又不得不做,是戰(zhàn)略層面的事,當前不做未來返工的成本巨大。以后每個企業(yè)都將成為數(shù)據(jù)驅動的企業(yè),打基礎的事情要盡早。
3.深化領域應用。雖然大數(shù)據(jù)的應用取得了一定進展,在互聯(lián)網(wǎng)、金融、電信等領域產(chǎn)生了實實在在的效益,醫(yī)療、工業(yè)領域也正在加速。但總體上只能說剛剛走出了小半步。一類是“平行替代”,如用金融和電信行業(yè)用分布式技術(如Hadoop)來重構原來的昂貴的數(shù)據(jù)倉庫。另一類則是“補課”,如政務、醫(yī)療、工業(yè)等領域,正在做的工作是在原有業(yè)務系統(tǒng)之外,新建本來早該建設的數(shù)據(jù)平臺。
這些大數(shù)據(jù)應用,顯然還不夠高大上,是物理反應,是量變而非質變,但的確也是發(fā)展必經(jīng)的階段。隨著這些“替代”型或“補課”型應用的深入,未來業(yè)務與數(shù)據(jù)將加深融合,越來越多數(shù)據(jù)驅動的新模式、新業(yè)態(tài)值得所有人期待。也只有這樣,數(shù)據(jù)強國戰(zhàn)略才能落到實處。(作者:魏凱,中國信息通信研究院云計算與大數(shù)據(jù)研究所主任、高級工程師)
責任編輯:陳卓陽