來源:大數(shù)據(jù)文摘 時間:2018-09-20 09:59:27 作者:
一個新的數(shù)據(jù)劃分方法
隨著大數(shù)據(jù)的興起,“言必稱數(shù)據(jù)”逐漸成了我們這個時代一個顯著的特征,但問題是,此數(shù)據(jù)非彼數(shù)據(jù)。
今天,所有“記錄”的結(jié)果,甚至包括文字,都被統(tǒng)稱為數(shù)據(jù)。這其中暗含的邏輯是,數(shù)據(jù)作為一個概念,它的內(nèi)涵擴(kuò)大了。傳統(tǒng)意義上的數(shù)據(jù)是人類對事物進(jìn)行測量的結(jié)果,是作為“量”而存在的數(shù)據(jù),可以稱為“量數(shù)”;今天的照片、視頻、音頻不是源于測量而是源于對周圍環(huán)境的記錄,是作為一種證據(jù)、根據(jù)而存在的,可以稱為“據(jù)數(shù)”。
量數(shù)雖然比據(jù)數(shù)更接近“數(shù)”,但從歷史上看,據(jù)數(shù)的出現(xiàn)要早于量數(shù)。人類早期對自身活動的記錄,即“史”,就是早期的據(jù)數(shù),也可以說,據(jù)數(shù)是歷史的影子。量數(shù)則是在記錄的實踐中慢慢產(chǎn)生的,特別是針對天空、星體、山川等外物的記錄,它們追求精確,于是我們逐漸延伸出測量的工具和行為。
一切科學(xué)都源于測量,量數(shù)是否充沛,決定了科學(xué)的種子何時萌芽,決定了科學(xué)是否發(fā)達(dá),也可以說,量數(shù)是科學(xué)的母親,其核心要義是精確。
進(jìn)入 20 世紀(jì)后,由于計算機(jī)、互聯(lián)網(wǎng)和智能手機(jī)的普及,據(jù)數(shù)開始爆炸,相較于 16 世紀(jì)的量數(shù)爆炸,據(jù)數(shù)爆炸的規(guī)模更大。今天大數(shù)據(jù)的主體,從體量上來看,毫無疑問是據(jù)數(shù),即對人類活動及周邊環(huán)境越來越多的記錄,或稱“普適記錄”?;ヂ?lián)網(wǎng)平臺記錄的,大部分是據(jù)數(shù)。
和今天的普適記錄相比,過去5 000年的文明看似浩如煙海,但其實相當(dāng)有限,史書雖然一本比一本厚,但大部分都聚焦在為數(shù)不多的帝王將相身上,關(guān)于普通百姓的個體性記錄,在全世界各個國家都少之又少。隨著普適記錄的興起,這種情況正在迅速改變,未來不僅有國家史、社會史、行業(yè)史,還會有數(shù)量驚人的“個人史”。可供歷史學(xué)家研究的資料,將會像雪球一樣越滾越大,其規(guī)模將前所未有。
量數(shù)對于中國的巨大意義,自不待言,黃仁宇的“數(shù)目字管理”在 20 世紀(jì)曾經(jīng)開啟過一場討論,我的前兩本書《大數(shù)據(jù)》《數(shù)據(jù)之巔》重點關(guān)注的是量數(shù),尤其是《數(shù)據(jù)之巔》,它延續(xù)了黃先生的討論,而本書更側(cè)重?fù)?jù)數(shù)。
一場還沒有完成的革命
今天的“大數(shù)據(jù)之熱”,熱的其實是據(jù)數(shù),和精確的量數(shù)幾乎沒有任何關(guān)系。
“據(jù)數(shù)之熱”并不奇怪,它源于互聯(lián)網(wǎng)帶來的變革和它已經(jīng)展現(xiàn)出來的巨大的財富效應(yīng),形形色色的手機(jī)應(yīng)用給了每一個人更加直觀的感受,不管是電商、社交還是自媒體,哪一個不是跟記錄之據(jù)數(shù)有關(guān)呢?
幾乎人類的一切行為,今天都可能、可以被記錄,并被轉(zhuǎn)化為據(jù)數(shù)。如果說量數(shù)的核心要義是“精確”,那據(jù)數(shù)的關(guān)鍵就在于“清晰”地留據(jù)。
因為智能手機(jī)的普及,據(jù)數(shù)已經(jīng)無處不在,但我們大部分人對據(jù)數(shù)的理解是膚淺的,迄今為止,以據(jù)數(shù)為中心的大數(shù)據(jù)討論主要停留在以下三個層面。
一是精準(zhǔn)營銷,即互聯(lián)網(wǎng)廣告業(yè)。和傳統(tǒng)的廣告業(yè)相比,今天的互聯(lián)網(wǎng)和智能手機(jī)通過記錄消費者不斷產(chǎn)生的數(shù)據(jù),可以向終端用戶推送個性化的廣告,這大大提高了行業(yè)效率。這是大數(shù)據(jù)革命在商業(yè)領(lǐng)域的起源。這也是目前互聯(lián)網(wǎng)企業(yè),無論是中國的 BAT(百度、阿里巴巴、騰訊),還是美國的谷歌、Facebook(臉譜網(wǎng))、亞馬遜最主要的贏利途徑。
二是商業(yè)和社會信用,其主體是金融機(jī)構(gòu)。除了精準(zhǔn)營銷,這是利用大數(shù)據(jù)賺錢的第二個法門,也是我們看到諸多互聯(lián)網(wǎng)企業(yè)陸續(xù)進(jìn)入金融領(lǐng)域的原因。其商業(yè)模式是,通過消費者的消費記錄評估消費者的信用,從后續(xù)的金融服務(wù)中贏利。例如阿里巴巴旗下的“芝麻信用”和騰訊旗下的“微粒貸”,它們在給消費者打“信用分”的基礎(chǔ)上,向單個消費者提供貸款等金融服務(wù)。
這兩種商業(yè)模式,都需要通過數(shù)據(jù)監(jiān)控消費者在互聯(lián)網(wǎng)上的一舉一動,消費者個體因此成為被觀察、被分析、被監(jiān)測的對象,這就帶出了第三個層面的問題—隱私。這兩種商業(yè)模式的副作用是,我們幾乎每天都能聽到數(shù)據(jù)泄露的新聞,時不時還會看到因為它而導(dǎo)致的悲劇。
這就是大眾眼中的大數(shù)據(jù),前兩者為商業(yè)利潤而生,而隱私問題屢屢成為社會公共話題。
可是,這三個層面僅僅揭開了冰山的一角,難道大數(shù)據(jù)就是養(yǎng)了幾家大公司,方便了公眾生活,改善了信用評級體系,讓生活更美好或者多了點麻煩這么簡單?我認(rèn)為遠(yuǎn)不止于此。
在商業(yè)層面,大數(shù)據(jù)還在進(jìn)一步深化變革,它所催生的互聯(lián)網(wǎng)應(yīng)用仍在不斷更新迭代。當(dāng)大數(shù)據(jù)完全發(fā)揮出它的潛力時,其最終形態(tài)將是全自動商業(yè),或稱智能商業(yè),商業(yè)文明將會被重塑和再造。
據(jù)數(shù)的商業(yè)化應(yīng)用帶動了大數(shù)據(jù)的興起,但商業(yè)只是故事的一個邊角,革命是社會化的,未來我們還會看到智能制造業(yè),它所依靠的還是數(shù)據(jù),數(shù)據(jù)引發(fā)的變化還在向社會治理和個人生活領(lǐng)域全面拓進(jìn),它涉及社會生活的方方面面,將會推動整個社會進(jìn)入文明新狀態(tài),改變社會的全貌。
一個新的故事正在世界范圍內(nèi)浮現(xiàn)。我們必須拋開細(xì)枝末節(jié),看到那些更深刻的、方向性的東西。數(shù)據(jù)的力量正在重塑整個社會甚至人類的天性。
我稱之為“數(shù)文明”。
一種新文明的興起
何謂文明?文明是歷史沉淀下來的,被絕大多數(shù)人認(rèn)可和接受的發(fā)明創(chuàng)造、人文精神以及公序良俗的總和。這些集合至少包括了以下要素:語言、文字、工具、道德、信仰、宗教、法律、家族、城邦和國家。
今天的數(shù)據(jù),包括了文字,還超越了文字,文字只是數(shù)據(jù)的一個子集,如果說文字是金子,那數(shù)據(jù)就是金屬。
在光明和文明之外,數(shù)據(jù)帶來了一種新的“明”。因為數(shù)據(jù),人類歷史上一些精細(xì)的、微妙的、隱性的,甚至曾經(jīng)難以捕捉表述的關(guān)系和知識,在今天都可以變?yōu)轱@性的關(guān)系和知識,清清楚楚地為人類所用;因為數(shù)據(jù),人類從來沒有像今天一樣清晰、明白、客觀、精確地認(rèn)知和管理自己所生活的社會;因為數(shù)據(jù),大量的事實可以被還原再現(xiàn),人類的僥幸心理得到了抑制,人性的幽暗之處得以變得光明,人類正在邁向一個更加文明、安全的時代。
在國家和社會的層面之上,我們將會看到更大的變化。越來越多的個人行為在被記錄,對國家而言,這意味著每一個國民個體、每一輛車甚至每一個其他物體都可以被追蹤。
如果懂得使用數(shù)據(jù),那么站在官僚層級的金字塔上,我們的社會將呈現(xiàn)出一種現(xiàn)在就非常清晰而且會越來越清晰的狀態(tài),據(jù)數(shù)就是這個高清社會的紋理。清晰性是有效治理的前提。
《數(shù)文明》堅持、發(fā)展了黃仁宇的“數(shù)目字管理”。我認(rèn)為,中國近百年來的落后,是源于眾多國民對精確的漠視,在中國的歷史上量數(shù)一度匱乏。
和量數(shù)相比,據(jù)數(shù)為國家治理提供了新的工具和手段。就此而言,用好大數(shù)據(jù)是通向國家治理現(xiàn)代化的最佳路徑。我甚至認(rèn)為,若論中國,我們的國家治理現(xiàn)代化,舍此途徑,無從抵達(dá)。
在中國的歷史上,曾經(jīng)長期存在德治和法治之爭,德治以仁愛為主,法治倡導(dǎo)峻法,爭了上千年,今天中國要建設(shè)法治社會已經(jīng)是共識,《數(shù)文明》要提出的,是數(shù)治。數(shù)治就是憑借對數(shù)據(jù)的有效收集、處理和分析來治理國家以及與之對應(yīng)的數(shù)據(jù)治理,數(shù)據(jù)治理將是國家治理的重要內(nèi)容。
對國家而言,以大數(shù)據(jù)為結(jié)果的互聯(lián)網(wǎng)代表的是新生的力量,它正在重塑傳統(tǒng)社會,比如智能攝像頭被廣泛應(yīng)用,大量的事實可以被還原再現(xiàn),人類的僥幸心理得到了抑制,人類的犯罪行為將會大幅減少,數(shù)治正在有效地解決人類對安全的根本性需要。
另一方面,大數(shù)據(jù)、互聯(lián)網(wǎng)又帶來挑戰(zhàn)。國家力量已經(jīng)不可能完全左右互聯(lián)網(wǎng)連接起來的有機(jī)社會了,相反,越來越多的公共功能在向私人公司、社會機(jī)構(gòu)轉(zhuǎn)移。
如何利用這股力量,又約束住這股力量?
這股力量可能會重塑整個社會的結(jié)構(gòu),催生新的政治文明,數(shù)治因此是一個具有挑戰(zhàn)性的話題。數(shù)治做好了,中國在這個新的時代就會具備“數(shù)據(jù)優(yōu)勢”,國家是這樣,企業(yè)亦然,各級地方政府也一樣。
一條可靠的成功路徑
數(shù)文明不僅和國家、社會相關(guān),也直接關(guān)系到個人。
對個人來說,掌握未來發(fā)展、演進(jìn)的方向,知道哪些行業(yè)將消失,哪些行業(yè)又將興起,這當(dāng)然非常重要。一個在黑夜中行走的人是走不快、走不遠(yuǎn)的,他也無法領(lǐng)略到沿途的風(fēng)景之美。
我認(rèn)為,在數(shù)文明的時代,通過記錄賦能,個人會成為高能個體,一個具備數(shù)據(jù)意識、數(shù)據(jù)頭腦和數(shù)據(jù)技能的數(shù)據(jù)公民當(dāng)然更容易獲得成功。新的時代會改變個人的命運,我們也應(yīng)該調(diào)整我們的價值觀。
記錄可以把偉人還原成普通人,抹去英雄與平民的差別。這不是把歷史虛無化,而恰恰是真實的歷史。中國人有崇拜先祖的傳統(tǒng),對先祖文明的推崇確保了我們文化的綿延不絕,有其積極意義,但是在大數(shù)據(jù)時代,我們更要看到另一層意義:偉人也是普通人,凡人也能走向成功,不必高山仰止,妄自菲薄。
記錄可以祛魅。祛魅,意味著打破不可知的神秘,凡人也可成功,人人皆有可能成功。
既然人人都可能成功,那在數(shù)據(jù)時代,一個人究竟如何才能邁向成功?
《數(shù)文明》分析了社會和商業(yè)的文明史,找出了文明發(fā)展的“金線”,而且我認(rèn)為,這條文明發(fā)展的“金線”也同樣適用于個人,可以幫助個人獲得職業(yè)上和專業(yè)上的成功。
通往個人專業(yè)成功的有效路徑就是記錄。就記錄而言,人腦不如電腦,因為人腦是微分機(jī)制,而電腦是積分機(jī)制。有效的學(xué)習(xí),更需要積分機(jī)制。善用記錄和數(shù)據(jù),我們就能在成功的道路上獲得能量“加持”。
個人的成功和一個民族的文明自有相通之處,這個相通之處就是記錄。因為普適記錄,個人更容易獲得成功,而推動文明發(fā)展的最終動力則是無數(shù)國民源源不斷的創(chuàng)新。正因如此,數(shù)文明的能量和潛力有可能超越歷史上所有的文明。在我看來,數(shù)據(jù)正在改變所有那些組成文明的要素,就像支付寶改變了傳統(tǒng)的銀行業(yè),微信改變了傳統(tǒng)的通信行業(yè)一樣,數(shù)文明在更優(yōu)越的模式的基礎(chǔ)上,將形成新的法則、新的語言、新的公序良俗甚至新的文化和信仰。數(shù)據(jù)的新力量,就如同農(nóng)耕之于古代文明,工業(yè)革命之于現(xiàn)代文明,數(shù)據(jù)將催生一種全新的文明形態(tài)。
一類新的隱私觀
當(dāng)然,新文明本身也問題纏身。
當(dāng)我們撥開大數(shù)據(jù)表面上的浮云,立刻就可以看到一個商業(yè)逐利和社會控制的世界。互聯(lián)網(wǎng)巨頭貪婪地吞噬著大數(shù)據(jù)的紅利。個人向互聯(lián)網(wǎng)企業(yè)讓渡的數(shù)據(jù)反過來為互聯(lián)網(wǎng)企業(yè)的“殺熟”行為提供了便利,無數(shù)人的個人生活被圈在一個固定的小天地里,看個性化推薦的新聞,閱讀個性化定制的消費指南,他們感覺很舒服,事實上,我們出讓的數(shù)據(jù)正在成為我們的電子腳鐐和枷鎖。
這是新文明的兩個悖論。一方面,數(shù)據(jù)越清晰、越全面、越真實,就越有利于個性化生產(chǎn),避免資源浪費,比如精準(zhǔn)營銷、個性化頁面、私人定制服務(wù);另一方面,數(shù)據(jù)又帶來了信息繭房、信息窄化的風(fēng)險。 一方面,大數(shù)據(jù)要求更加開放甚至是無限制的聯(lián)接,另一方面這又將傷害個人的隱私和權(quán)利。
那該如何看待新文明的問題? 文明不是生來就是其最終形態(tài)的,它會磨合、變幻,才能最終為大多數(shù)人所接受,成為一種認(rèn)同、一種信仰。今天信息技術(shù)的發(fā)展提供了新的可能,但數(shù)文明最終的形態(tài)是需要大家一起創(chuàng)造的。
事實上,上述悖論也可能很快被破解。比如,通證經(jīng)濟(jì)來臨,區(qū)塊鏈技術(shù)正日臻完善,未來一個人的數(shù)據(jù)很可能并不保存在大型互聯(lián)網(wǎng)公司,而是保存在一個公共的區(qū)塊鏈上,這些企業(yè)使用我們的數(shù)據(jù)都必須經(jīng)過我們的同意,被區(qū)塊鏈記錄。只能說,我們目前所見證的數(shù)據(jù)革命,還遠(yuǎn)遠(yuǎn)沒有結(jié)束,如果真要說結(jié)束,那也只是一個序曲的結(jié)束。
即使是隱私問題,隨著人工智能的普及,它也在出現(xiàn)新的態(tài)勢,我認(rèn)為整個人類,無論東方或西方,亟須建立一種新的隱私觀。
例如,被中國大眾頻繁詬病的“大數(shù)據(jù)殺熟”和“千人千價”,它們是通過算法對數(shù)據(jù)的自動處理實現(xiàn)的,主觀上它沒有泄露任何人的數(shù)據(jù)。這就是新的情況:你的數(shù)據(jù)都是算法和機(jī)器在處理,并沒有被泄露給“人”,在一定程度上,你的隱私并沒有受到“人為”的侵犯。人為泄露個人數(shù)據(jù)的案例和情況當(dāng)然還會出現(xiàn),但我相信會越來越少。我們的數(shù)據(jù)需不需要對算法和機(jī)器保密?這才是一個新的問題。
我們不會介意自然環(huán)境在注視或監(jiān)視我們,那我們是否介意算法和機(jī)器注視著我們?或者說,我們應(yīng)該介意嗎?未來,算法和機(jī)器就是我們生活環(huán)境的一部分,讓機(jī)器了解我們,向機(jī)器開放我們的數(shù)據(jù),這恐怕是通向智能時代、機(jī)器人時代、人機(jī)協(xié)同時代唯一的選擇。
人類新的隱私觀,其核心是要為商業(yè)和公共領(lǐng)域的算法劃定一個使用個人數(shù)據(jù)的邊界。
數(shù)文明的發(fā)展和延續(xù),我相信是以百年、千年的時間為單位的,探討數(shù)文明,就是思考人類的百年大計、千年大計。不管是國家還是個人,我們需要跟上新文明的演進(jìn)步伐,否則就可能被新文明所淘汰。
本文整理自《數(shù)文明:大數(shù)據(jù)如何重塑人類文明、商業(yè)形態(tài)和個人世界》涂子沛著
責(zé)任編輯:方茶云