來源:數(shù)據(jù)派THU 時間:2017-08-31 11:04:30 作者:沈陽
大數(shù)據(jù)時代以其“4V”(即Volume體量大、Variety類型多、Value價值巨大、Velocity處理速度快)的神力不斷影響和改造著世界,作為一種全新的思想和手段,新媒體大數(shù)據(jù)、輿論大數(shù)據(jù),營銷大數(shù)據(jù)、公關(guān)大數(shù)據(jù)和廣告品牌大數(shù)據(jù)等各個領(lǐng)域的各類大數(shù)據(jù),澎湃洶涌地推動著傳媒業(yè)從量變到質(zhì)變,開辟出了傳媒業(yè)轉(zhuǎn)型發(fā)展的新機(jī)遇。本期由清華—青島數(shù)據(jù)科學(xué)研究院主辦、清數(shù)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟承辦的“應(yīng)用·創(chuàng)新”系列講座,邀請到清華大學(xué)新聞與傳播學(xué)院的沈陽教授。他是橫跨信息管理、新聞傳播和計算機(jī)科學(xué)三個專業(yè)的教授,多個部委的專家組成員,清博大數(shù)據(jù)的早期創(chuàng)始人,具有豐富的新媒體投融資、數(shù)據(jù)分析和新媒體戰(zhàn)略經(jīng)驗?! ?
今年5月24日數(shù)據(jù)派發(fā)布過一期沈老師主講的“應(yīng)用·創(chuàng)新”系列講座之《數(shù)據(jù)與新媒體》,本場講座沈老師演講的主題“大數(shù)據(jù)驅(qū)動下的媒體業(yè)轉(zhuǎn)型”對上一期的內(nèi)容做了補(bǔ)充和升級,相信大家會從中得到更多的新視角和新啟示。
大數(shù)據(jù)連接論的三大要素
首先,大數(shù)據(jù)的終極目標(biāo)是連接。人類社會從早期的語言的思想的連接,慢慢過渡到紙質(zhì)的連接,再到廣播電視的連接,再到PC互聯(lián)網(wǎng)的連接,如今是移動互聯(lián)網(wǎng)的連接,這種連接的頻度不斷提升。如果把連接看作人和事物、人和人之間的某種特定的相關(guān)性,這種特定相關(guān)性從整個人類的角度來說是越來越強(qiáng)的,它不僅是一個手段,很可能也是一個最終目標(biāo)。
其次,連接有量的變化,其中會因為量變而產(chǎn)生一系列不同的效應(yīng)。如果你連接了一個人,那有可能是你的家人;當(dāng)你連接了10個人,就達(dá)到了社會學(xué)家所說的跟你關(guān)系最密切的初級群體,由此可以推算出你的社會地位,你的財富,就是你最好的六個朋友的平均值;當(dāng)你連接到100個人,就接近了鄧巴數(shù),即150定律(Rule Of 150),該定律是根據(jù)猿猴的智力與社交網(wǎng)絡(luò)推斷出:人類智力將允許人類擁有穩(wěn)定社交網(wǎng)絡(luò)的人數(shù)是148人,四舍五入大約是150人,這是與你能親密互動人群的上限;當(dāng)你連接到1000個人,就達(dá)到了凱文凱利提到的社區(qū)啟動的條件,倘若這1000人恰好都是你的忠粉,你就可以靠他們養(yǎng)活自己;當(dāng)你連接到10000個人,偶發(fā)效應(yīng)會特別強(qiáng),每次發(fā)布消息后都會反饋出想象不到的結(jié)果,而且這些人的朋友圈發(fā)布的消息也會給人很多意想不到的幫助。比如,九寨溝地震前,打算去九寨溝旅游的人因為在朋友圈刷到一張九寨溝人山人海的照片而取消行程,幸而逃過一劫,與地震擦肩而過。
當(dāng)你連接到十萬人會發(fā)生什么,在微信里面顯示為100000+,可以理解成你足以在某個細(xì)分領(lǐng)域形成非常大的影響,如果這個量級到達(dá)百萬會發(fā)生什么事?百萬的網(wǎng)絡(luò)連接,足以使人可以脫離于現(xiàn)實世界,在網(wǎng)絡(luò)中完成一個生存的閉環(huán)。假設(shè)你有一百萬真實的粉絲,你發(fā)一條微博,可能就幾萬塊錢了,這個時候你的經(jīng)濟(jì)來源已經(jīng)通過網(wǎng)絡(luò)解決了,你的吃穿用也都可以通過在線購買,獲得專門的機(jī)構(gòu)服務(wù)。
如果這個量級到達(dá)千萬又會發(fā)生什么呢?人民日報對外公布的粉絲數(shù)就是一千多萬。故當(dāng)你連接到一千萬人,你基本上就成為了各大媒體平臺的頭把交椅,像快手里面的號稱第一大號的【MC天佑】、微信粉絲千萬的公眾號【咪蒙】,所以你會發(fā)現(xiàn)連接到千萬,足以在一個細(xì)分領(lǐng)域當(dāng)中逐步占據(jù)頭部的位置。接下來,如果連接到一億人,那你足以在某個細(xì)分領(lǐng)域挑戰(zhàn)BAT(BAT,B=百度、A=阿里巴巴、T=騰訊,中國互聯(lián)網(wǎng)公司百度公司(Baidu)、阿里巴巴集團(tuán)(Alibaba)、騰訊公司(Tencent)三大互聯(lián)網(wǎng)公司首字母的縮寫)。騰訊的微信活躍用戶有九億多,如果你連接到十億人,你就成了騰訊;而如果你能連接到二十億人,那你就成為了Facebook。
第三,除了量的積累之外,也有一個質(zhì)的演化。質(zhì)的演化有幾個要點:第一個要點是任何連接一旦建立,不會滿足于單一的連接形態(tài),而是會附加各種各樣的功能。所謂“全家桶”模式便是,用戶只要安裝了一個APP,就會被不斷推薦安裝更多的APP,這就是不滿足于單一的連接形態(tài)。第二個要點是不管這個連接的量有多大,最重要的是對自身結(jié)點的賦能,促使自身進(jìn)化為關(guān)鍵連接點。
任何一個連接都需要去依托于平臺,依托于某種工具,語言也可以被看作一個連接的媒介。那么未來,如果按照這條原理,在這些連接過程當(dāng)中,連接是會進(jìn)化的。任何一個數(shù)據(jù)連接都有可能會被新的連接所取代。
那么取代的規(guī)律是什么呢?如果一種新的連接要替代一種老的連接,這種新連接的頻度要更高、更快、更緊密、更美好。按照連接論分析,在手機(jī)上要取代微信的軟件,目前在中國基本上沒有。但是如果按照連接的進(jìn)化條件來說,什么東西能取代手機(jī)呢?或許有三種東西。
第一種是比人們本身的交互次數(shù)更高的、更多的一種設(shè)備,有可能是人們用眼神控制的設(shè)備。人們每用眼神掃描一下智能眼鏡,它就可以完成一次交互。由此推之,人們跟這個智能眼鏡交互次數(shù)是可以超過手機(jī),因為手機(jī)作為媒介的交互頻度是遠(yuǎn)超報紙的,甚至可以認(rèn)為是高50倍以上。而智能眼鏡可能比手機(jī)的交互次數(shù)高100倍,人們每天可以指揮這個智能眼鏡,用眼神掃描即可。
第二種取代手機(jī)的設(shè)備是基于人工智能技術(shù)。想象未來人們一進(jìn)家門,通過智能語音問答系統(tǒng),眼前就能展現(xiàn)出一個虛擬的影像場景。隨著人工智能的進(jìn)一步發(fā)展,智能硬件會帶來變革,智能云可以調(diào)動家里所有的設(shè)備。
第三種則是更為大膽的想象,平時與人們交互次數(shù)最多的是什么?衣服或許就是一種選擇。一個人每天跟衣服的交互次數(shù)高于一萬次,從這個角度來說,未來可能會有一家偉大的互聯(lián)網(wǎng)公司,就是做衣服的交互連接。
總之,按照這個原則,任何數(shù)據(jù)連接都應(yīng)該有可能會被新的連接所取代。
連接是最高的形式,是思想和認(rèn)知的連接
人跟人之間的物質(zhì)連接是短暫的,但是思想性的連接是永久的。數(shù)據(jù)在這里面所起到的作用,就是讓人們的認(rèn)知更加深刻。大數(shù)據(jù)時代,一個人到底能被貼上多少個標(biāo)簽?zāi)?Facebook里面一個賬號,可以被打上幾百萬個標(biāo)簽,這些標(biāo)簽基于其瀏覽過的每一條Facebook文章,包括其任何一個細(xì)節(jié)的屬性。
以此為例,標(biāo)簽可以幫助在Facebook數(shù)億的賬號里進(jìn)行篩選。當(dāng)某一個對象的數(shù)據(jù)被刻畫得越精致時,人們對這個世界的認(rèn)識程度也隨之大幅加深。
當(dāng)然,連接也存在過載和疏離的現(xiàn)象。過載現(xiàn)象指的是,當(dāng)越來越多的連接高速進(jìn)行而產(chǎn)生過載時,人們可能會消減目前過載的狀態(tài),然后進(jìn)行聚焦。疏離現(xiàn)象指的是,連接好友過多之后,人們反而跟現(xiàn)實社會更加疏離,進(jìn)而產(chǎn)生強(qiáng)烈的疏離感。以游戲工會為例,一個游戲工會可能多達(dá)百萬人。很多身處其中的年輕人的生活狀態(tài)是,在網(wǎng)吧里面玩游戲,打下金幣和寶物換錢,換了錢之后在網(wǎng)吧里面叫外賣,累了就到網(wǎng)吧邊上的酒店去休息,基本上不接觸外面的世界。這是網(wǎng)絡(luò)連接加強(qiáng)之后,用戶對社會產(chǎn)生疏離感的真實寫照,是連接帶來的另一方面不太積極的影響。
數(shù)據(jù)連接的理想狀態(tài):輕于鴻毛,重如泰山
以微信為例,其作為數(shù)據(jù)連接器能夠提供給用戶便捷的使用體驗,這是其輕于鴻毛的一面。而微信背后的計算紛繁復(fù)雜,有強(qiáng)大的技術(shù)支撐,這是其重如泰山的一面。
現(xiàn)在很多大數(shù)據(jù)平臺在首頁上就為用戶呈現(xiàn)出極其復(fù)雜的功能,其實是顛倒了這兩個方面。理想狀態(tài)應(yīng)當(dāng)是前端“輕于鴻毛”,后端“重于泰山”。根據(jù)這個原理,大數(shù)據(jù)的邏輯可以簡化成20個字,這20個字體現(xiàn)著大數(shù)據(jù)平臺真正的價值——發(fā)現(xiàn)問題,感知風(fēng)險,解決問題,建立連接,預(yù)測未來。
首先,發(fā)現(xiàn)問題,這是大數(shù)據(jù)研究的首要一步。第二,感知風(fēng)險,或者叫感知變化。大數(shù)據(jù)系統(tǒng)做出來之后,應(yīng)該能夠連續(xù)分析其中蘊含的風(fēng)險、變化的實質(zhì)。第三,解決問題。目前解決問題多數(shù)手段仍在線下,且多需要第三方輔助,所以這方面重要性有所提升。第四,建立連接。把世界上更多的人連接起來,這是很重要的基礎(chǔ)目標(biāo)。第五,預(yù)測未來,只是最終目的——數(shù)據(jù)系統(tǒng)到底能預(yù)測到什么,能預(yù)測多久的事情。今年3月,沈老師提出“輿論預(yù)報”的概念。這可以是整個輿論場里面的短期預(yù)報,如明天的天氣指數(shù);也可以是長期預(yù)報,如一年內(nèi)全體中國人的情緒會有什么樣變化。
沈陽團(tuán)隊的數(shù)據(jù)研究,如輿情系統(tǒng)僅做了一年時間,但目前其機(jī)構(gòu)用戶數(shù)已經(jīng)位居行業(yè)前列。然而,沈老師表示,團(tuán)隊目前搭建的平臺仍然處于非常初級的階段?;诖髷?shù)據(jù)連接論歸納的這20個字:發(fā)現(xiàn)問題、感知風(fēng)險、解決問題、建立連接、預(yù)測未來,是團(tuán)隊不斷提升迭代的重要準(zhǔn)則。
通過搭建平臺的經(jīng)歷,沈老師發(fā)現(xiàn)數(shù)據(jù)實際上可以分為三類:一類是to G,一類是to B,一類是to C,每類的要求各不相同。to G,是指對政府而言。從本質(zhì)上看,政府不需要產(chǎn)品,而是服務(wù)。to B,它需要大數(shù)據(jù)的場景更多是群體決策,待考慮的因素較多。to C,秉著輕于鴻毛的原則,產(chǎn)品良好體驗性至關(guān)重要。所以大數(shù)據(jù)類別不同時,它的要求也千差萬別。
去年下半年,沈老師曾提出一個模型——五層的表里數(shù)據(jù)關(guān)聯(lián)模型。所有的數(shù)據(jù)都可以被分做五類:第一大類就是原來的百度、谷歌等搜索引擎能搜索到的數(shù)據(jù),其為表層數(shù)據(jù)。表層數(shù)據(jù)沒有太大的門坎,任何人都可以做一個蜘蛛爬蟲去爬。第二類是手機(jī)APP里面蘊含的數(shù)據(jù),這叫表二層數(shù)據(jù)。這種數(shù)據(jù)的獲取難度比表一層稍微難一點,但是門坎仍然不是特別高。其獲取方式可以通過爬蟲,模擬手機(jī)抓取回來。第三類是里一層數(shù)據(jù),這是每個單位內(nèi)部的數(shù)據(jù),比如信息管理系統(tǒng)的數(shù)據(jù)等。第四類是里二層數(shù)據(jù),這是每個人產(chǎn)生的數(shù)據(jù),價值性非常高。第五類是里三層數(shù)據(jù),是每個人的基因數(shù)據(jù)。設(shè)想未來,可能再過20年左右,每個人到任何一個單位可能都會被要求提交基因數(shù)據(jù),由此其人的許多特性概率即可被獲知,如犯罪概率等。這類數(shù)據(jù)在某種程度上相當(dāng)可怕,因為這類數(shù)據(jù)將會使得人類陷入一種未來確定論的境界。
從實際著手去做大數(shù)據(jù)的角度來說,若想要獲得里層數(shù)據(jù),需要擁有如微信等作為自有平臺,在后臺便可以拿到用戶的所有信息。在里層數(shù)據(jù)里面,里二層數(shù)據(jù)即每個人的數(shù)據(jù)非常寶貴。數(shù)據(jù)的最高價值就是能夠從APP里面獲得的各方面數(shù)據(jù)。
第二層有價值的數(shù)據(jù)是什么?在APP里埋SDK(軟件開發(fā)工具包,外語首字母縮寫:SDK、外語全稱:Software Development Kit。一般都是一些軟件工程師為特定的軟件包、軟件框架、硬件平臺、操作系統(tǒng)等建立應(yīng)用軟件時的開發(fā)工具的集合。),故而能拿到APP中的數(shù)據(jù)。但受限于協(xié)議,有些數(shù)據(jù)是平臺無法觸及的。
以今日頭條等大數(shù)據(jù)信息平臺為例,其可以隨意向受眾推送信息,但是埋SDK最大的問題是信息平臺無法向受眾推送平臺想讓受眾看到的商品信息。所以在這個大數(shù)據(jù)的世界當(dāng)中,最底層的是自己自有渠道拿到的數(shù)據(jù),第二層是信息平臺在這個渠道當(dāng)中埋SDK,拿到的受眾數(shù)據(jù)。然后再往上就是信息平臺也埋不了SDK,把所有的表層數(shù)據(jù)收集起來進(jìn)行分析。
所以,未來會有一個公司,把網(wǎng)絡(luò)當(dāng)中所有的ID號的數(shù)據(jù)全部收集起來,這個量級可能在千億級別的ID號,用戶只要在百度貼吧、微博、豆瓣等平臺發(fā)布一則內(nèi)容,大數(shù)據(jù)公司就可以全部將此聯(lián)系起來,然后來分析這些ID之間的匹配關(guān)系。做不了ID大數(shù)據(jù),還可以退而求其次做IP大數(shù)據(jù),首先攻克網(wǎng)絡(luò)里面有名氣的、有價值的賬號。
今天的大數(shù)據(jù)到底發(fā)展到了什么階段呢?前幾日,一篇微信文章中整理了國內(nèi)70家最大的大數(shù)據(jù)公司,但這70家里面還有一些領(lǐng)域沒有覆蓋,這意味著目前仍處于上半場。即便如此,在某些價值密度高的領(lǐng)域,有些公司的規(guī)模已經(jīng)較為龐大,這就意味著某些領(lǐng)域已經(jīng)到中場,因此沈老師判斷大數(shù)據(jù)正處于從上半場轉(zhuǎn)向中場這樣一個階段。這就意味著今天的大數(shù)據(jù)領(lǐng)域,類似于20年前的房地產(chǎn),大部分地方還是空地,但是有些大城市已經(jīng)被廣泛圈地。
根據(jù)后來的細(xì)分領(lǐng)域,沈老師提出了一個新概念——大數(shù)據(jù)的產(chǎn)業(yè)接觸點。假設(shè)現(xiàn)在有大數(shù)據(jù)公司再來做服裝資訊,就已經(jīng)沒有必要了,因為服裝資訊已經(jīng)有一家蝶訊網(wǎng),且已經(jīng)完成新三板上市,所以,這時候就可以考慮做服裝設(shè)計的軟件大數(shù)據(jù),中國在這個領(lǐng)域可能還沒有形成一個巨頭,這就是可以嘗試的方向。又或者去做服裝面料的采購,這可能將是一個B2B的交易市場。再或者可以去做服裝貿(mào)易加工工廠的大數(shù)據(jù),中國服裝加工工廠非常多,如果覺得這個市場量太小了,那就可以做服裝行業(yè)、紡織行業(yè)工人的大數(shù)據(jù),這個量就很大。所以這表明一條線從to G的管理到to B的交易再到to C的廣泛使用,在任何一個行業(yè)都可以按照這個邏輯去切入。目前做通用大數(shù)據(jù),這個市場的競爭已經(jīng)非常激烈;所以,沈老師認(rèn)為下一個階段,行業(yè)大數(shù)據(jù)規(guī)模會進(jìn)一步持續(xù)擴(kuò)大,這個量級會增長到人們難以想象的地步。
大數(shù)據(jù)的運用非常廣泛,從輿論的角度來說也非常有趣。在整個輿論行業(yè)當(dāng)中,一個比較大的問題是輿論的客觀性和不客觀性。如今一個重要的課題擺在人們眼前,即如何去甄別真實的言論和虛假的言論。很不幸的是,現(xiàn)在的水軍越來越像真實的人,好像沒有什么機(jī)器在電腦上操作不了的事情。小冰,一個人工智能的產(chǎn)品,他寫的詩比很多人寫的還要好,他已經(jīng)完成了這種進(jìn)化,整個人類已經(jīng)開始進(jìn)入到人本身的ID、人本身的資訊、人工智能以及機(jī)器產(chǎn)生的資訊和ID大規(guī)模共存的時代,這對輿情的影響非常之大。以上是在輿情研究中需要重點考慮的第一個要素。
第二個要素是如今越來越分散的平臺,多平臺到達(dá),多渠道網(wǎng)絡(luò),多媒介融合。在這樣一種狀態(tài)下,大數(shù)據(jù)想要去尋找一個傳播路徑,尋找一個產(chǎn)品,在不同的平臺當(dāng)中的品牌度、聲量值、美譽度,實際上是一個比較復(fù)雜的課題,從另一方面來說,這個課題也就因此極具價值。
在如今的大數(shù)據(jù)形勢下,沈老師認(rèn)為營銷、廣告、公關(guān)、品牌這四個方面其實相互統(tǒng)一,或者說是一個共同體。也就是說此時可能需要一個精算的工具,需要能把不同平臺的粉絲連接起來的工具,同時可能也需要在不同平臺當(dāng)中測算不同轉(zhuǎn)化率的工具。假設(shè)今天有了資訊數(shù)據(jù),能不能考慮把環(huán)保數(shù)據(jù)納入進(jìn)來,然后根據(jù)環(huán)保的數(shù)據(jù)、霧霾的數(shù)據(jù),進(jìn)而影響北京的輿論場。想要做預(yù)報的話,需要把環(huán)保數(shù)據(jù)和資訊數(shù)據(jù)進(jìn)行整合。正如剛才強(qiáng)調(diào)的,不管是大數(shù)據(jù)連接論也好,還是指數(shù)大數(shù)據(jù)、輿論大數(shù)據(jù)、營廣公品(營銷、廣告、公關(guān)、品牌)大數(shù)據(jù),人類的一個終極目標(biāo)就是把所有的數(shù)據(jù)連接起來,未來在全世界的范圍內(nèi),人類可能就身處一個國家。如果真有走向這一步的那天,人類更需要強(qiáng)有力的連接手段,包括更好的測算模型以及在倫理方面的更加精確和精妙的把握。
責(zé)任編輯:陳近梅