來(lái)源:數(shù)據(jù)觀-企業(yè) 時(shí)間:2017-08-08 15:12:08 作者:謝軍
近日,天翼智能生態(tài)博覽會(huì)于廣州順利落下帷幕。本屆博覽會(huì)以“智能創(chuàng)造未來(lái)”為主題,圍繞五大生態(tài)圈,設(shè)立了智能連接、智慧家庭、天翼物聯(lián)網(wǎng)、互聯(lián)網(wǎng)金融、云和大數(shù)據(jù)等5大主題展區(qū),全面展示了智能生態(tài)發(fā)展成果。
TalkingData數(shù)據(jù)合作總經(jīng)理謝軍作為受邀嘉賓前往活動(dòng)現(xiàn)場(chǎng),并在大數(shù)據(jù)分論壇與諸位嘉賓觀眾分享了題為《場(chǎng)景化重塑數(shù)據(jù)價(jià)值》的演講。
謝軍表示:全球各個(gè)行業(yè)的數(shù)據(jù)存儲(chǔ)量每年都在以50%的速度暴增,根據(jù)IDC的數(shù)據(jù)顯示:全球存儲(chǔ)量?jī)H在2011年已達(dá)到1.8ZB, 預(yù)計(jì)2020年將超過(guò)40ZB。ZB,十萬(wàn)億億字節(jié),這相當(dāng)于每個(gè)中國(guó)人每分鐘發(fā)3條微博,一共寫(xiě)2.6976萬(wàn)年才能完成。
然而數(shù)據(jù)的爆炸式增長(zhǎng),并不等同于價(jià)值的水到渠成。在我們以往的合作中,我們經(jīng)常能看到許多企業(yè)的數(shù)據(jù)不但沒(méi)有成為產(chǎn)生二次價(jià)值的資產(chǎn),還變成了花費(fèi)了高額的服務(wù)器及帶寬的成本項(xiàng)。DT時(shí)代,如何進(jìn)行數(shù)據(jù)的價(jià)值挖掘,已經(jīng)已經(jīng)成為企業(yè)必須面對(duì)的課題。
??????
事實(shí)上,數(shù)據(jù)本身沒(méi)有價(jià)值,只有當(dāng)數(shù)據(jù)轉(zhuǎn)化為支撐決策的智慧,價(jià)值才得以體現(xiàn)。我們把數(shù)據(jù)價(jià)值化的過(guò)程抽象為四個(gè)階段:數(shù)據(jù)-信息-知識(shí)-智慧。從海量的數(shù)據(jù)中進(jìn)行分析洞察,將數(shù)據(jù)轉(zhuǎn)化為可讀易懂的信息,從信息中抽象出規(guī)律將其變?yōu)榭梢罁?jù)可遵循的知識(shí),最后通過(guò)知識(shí)輔助決策,解決實(shí)際問(wèn)題。數(shù)據(jù)的進(jìn)階過(guò)程,始終需要一種能量貫穿始終,這就是場(chǎng)景化。
??????
說(shuō)到場(chǎng)景,我們很容易聯(lián)想到戲劇與電影的語(yǔ)境,“場(chǎng)”表示時(shí)間,“景”表示空間,場(chǎng)景是時(shí)間中的空間,是一幕幕時(shí)空片段。著名心理學(xué)家勒溫提出了一個(gè)抽象理論:一個(gè)人的行為取決于帶有個(gè)性的這個(gè)人與他所處環(huán)境的相互作用。即B=F(P*E)。其中E-Environment就是我們所說(shuō)的場(chǎng)景,它包括周邊環(huán)境以及因此產(chǎn)生的心理環(huán)境。
讓我們用從數(shù)據(jù)業(yè)務(wù)的角度解讀這一公式:B-Behavior是企業(yè)所能撬動(dòng)的每一次用戶(hù)交互; P-Personality是帶有個(gè)性化標(biāo)簽的用戶(hù)個(gè)體; E-Environment則是構(gòu)建出的業(yè)務(wù)場(chǎng)景標(biāo)簽及業(yè)務(wù)感受標(biāo)簽。而這里的F就是數(shù)據(jù)科學(xué)家根據(jù)業(yè)務(wù)需求及場(chǎng)景構(gòu)建的算法;歸納來(lái)說(shuō)就是在特定的場(chǎng)景中選擇特定的用戶(hù)群能夠更高概率的促成特定的行為交互。整個(gè)定式詮釋的正是場(chǎng)景化業(yè)務(wù)模型的生成法則,我們可以稱(chēng)之為場(chǎng)景化模型定式。
?
當(dāng)我們把這一定式靈活的運(yùn)用到數(shù)據(jù)業(yè)務(wù)中,你會(huì)發(fā)現(xiàn)數(shù)據(jù)的組織思路非常清晰。無(wú)論是復(fù)雜的數(shù)據(jù)工程還是具體到數(shù)據(jù)業(yè)務(wù),都可以圍繞著B(niǎo)、P、E靈活開(kāi)展。
說(shuō)到數(shù)據(jù)工程,首先來(lái)看一下TalkingData 的數(shù)據(jù)工程流程閉環(huán),整個(gè)過(guò)程被分為四個(gè)階段:獲取、組織、分析、動(dòng)作,四個(gè)階段不是獨(dú)立分割,而是環(huán)環(huán)相扣。比如當(dāng)我們開(kāi)始獲取數(shù)據(jù)的時(shí)候,就要去考慮最終收獲什么,對(duì)哪類(lèi)業(yè)務(wù)起到促進(jìn)作用。同樣,當(dāng)我們用場(chǎng)景化標(biāo)簽進(jìn)行數(shù)據(jù)增強(qiáng)時(shí),業(yè)務(wù)指標(biāo)是拆分場(chǎng)景的方向盤(pán)。
從12年至今,TalkingData自身的數(shù)據(jù)工程支撐著每天2.5億的移動(dòng)端app活躍終端的數(shù)據(jù)更新及加工,同時(shí)數(shù)據(jù)平臺(tái)還接入了許多第三方公司的數(shù)據(jù)能力,進(jìn)行多源數(shù)據(jù)的場(chǎng)景化服務(wù)編織。我們幫眾多企業(yè)搭建了屬于他們自己的數(shù)據(jù)工程平臺(tái),完成了一方數(shù)據(jù)的價(jià)值重構(gòu),并為企業(yè)擴(kuò)展三方數(shù)據(jù)的能力,幫企業(yè)梳理場(chǎng)景、設(shè)計(jì)算法、定義價(jià)值模型。
我們堅(jiān)信:未來(lái),能夠更好的應(yīng)用異構(gòu)的、情境化的數(shù)據(jù),能夠擁有更智能的算法,能夠駕馭智能數(shù)據(jù)的企業(yè)才更有市場(chǎng)競(jìng)爭(zhēng)力。
聚焦到數(shù)據(jù)工程中的標(biāo)簽抽取,雖然數(shù)據(jù)雜亂無(wú)章,但抽取邏輯可以很清晰。我們依然套用剛才的場(chǎng)景化模型定式,標(biāo)簽實(shí)際上是找到可具體化的P、B、E。以人為中心,匯聚業(yè)務(wù)或場(chǎng)景的標(biāo)簽,再按業(yè)務(wù)或場(chǎng)景歸集,能夠形成一套精細(xì)化的行業(yè)(或業(yè)務(wù))標(biāo)簽體系。
在場(chǎng)景化標(biāo)簽的構(gòu)建過(guò)程中,P、B、E標(biāo)簽的快速重構(gòu)是標(biāo)簽庫(kù)能否靈活對(duì)接業(yè)務(wù)的關(guān)鍵,同時(shí)也是數(shù)據(jù)工程智能化的標(biāo)志之一。標(biāo)簽重構(gòu)最常用的方法是行為標(biāo)簽轉(zhuǎn)移。通過(guò)業(yè)務(wù)經(jīng)驗(yàn)、市場(chǎng)定位、綜合印象等,可形成針對(duì)特定“場(chǎng)景”的行為或人的認(rèn)知,當(dāng)遇到這些場(chǎng)景時(shí),我們不但可以給人打上場(chǎng)景標(biāo)簽,還可以給這類(lèi)人打上一個(gè)關(guān)聯(lián)的行為標(biāo)簽或角色標(biāo)簽。
通過(guò)場(chǎng)景連接起的“人”與“行為”間的關(guān)系,可將“行為”或“人”的標(biāo)簽快速?gòu)?fù)制。除此之外我們還可以根據(jù)在固定場(chǎng)景中行為發(fā)生的頻次來(lái)構(gòu)建新的場(chǎng)景,如職住地標(biāo)簽;通過(guò)算法模型進(jìn)行行為預(yù)測(cè)或人群放大,從而把已知樣本的B、E、P標(biāo)簽擴(kuò)展到未知的目標(biāo)樣本上。
我們以上談到的數(shù)據(jù),是以人為本的場(chǎng)景域數(shù)據(jù),這部分是數(shù)據(jù)價(jià)值的核心。整個(gè)ETL的過(guò)程,就是場(chǎng)景化組織的過(guò)程,在組織數(shù)據(jù)的過(guò)程,除了人本數(shù)據(jù),我們還會(huì)遇到許多和人弱關(guān)聯(lián)的數(shù)據(jù),這部分?jǐn)?shù)據(jù)也需要找到與場(chǎng)景的關(guān)聯(lián),并被保存,為將來(lái)的場(chǎng)景延伸與業(yè)務(wù)探索打好基礎(chǔ)。
在實(shí)際業(yè)務(wù)運(yùn)營(yíng)中,通過(guò)場(chǎng)景化模型定式依然可以清晰梳理出執(zhí)行邏輯。以數(shù)據(jù)營(yíng)銷(xiāo)業(yè)務(wù)為例,客戶(hù)在確定B即業(yè)務(wù)目標(biāo)時(shí),會(huì)根據(jù)以往的業(yè)務(wù)經(jīng)驗(yàn)說(shuō)出一些典型場(chǎng)景比,如**位置、**時(shí)間、**媒介等。而數(shù)據(jù)分析師需要根據(jù)目標(biāo)B進(jìn)行場(chǎng)景預(yù)測(cè),或者說(shuō)場(chǎng)景初始化,找出各類(lèi)場(chǎng)景標(biāo)簽E及對(duì)應(yīng)的人的標(biāo)簽P,保證算法有足夠的變量,最終計(jì)算出高概率人群。
場(chǎng)景預(yù)測(cè)的過(guò)程是抽絲剝繭,數(shù)據(jù)分析師需要列出跟目標(biāo)B有關(guān)聯(lián)性的一系列小B動(dòng)作, 然后再推演出相應(yīng)的場(chǎng)景E與由用戶(hù)P,最后通過(guò)算法計(jì)算出可實(shí)現(xiàn)目標(biāo)B的最高概率人群P. 把用戶(hù)群P推進(jìn)業(yè)務(wù)場(chǎng)進(jìn)行驗(yàn)證,得到實(shí)際的轉(zhuǎn)化用戶(hù),一個(gè)數(shù)據(jù)驅(qū)動(dòng)的閉環(huán)就基本完成。
多數(shù)情況下,初始的算法未必會(huì)讓客戶(hù)滿(mǎn)意,這時(shí)候就需要用機(jī)器代替人腦放大智慧,也就是我們今天常說(shuō)的人工智能。通過(guò)機(jī)器學(xué)習(xí)對(duì)轉(zhuǎn)化用戶(hù)的行為、場(chǎng)景及人口屬性參數(shù)進(jìn)行歸納與優(yōu)化,動(dòng)態(tài)調(diào)整參數(shù)與權(quán)重,優(yōu)化算法路徑,生成最有效的業(yè)務(wù)模型。
除了人本數(shù)據(jù)的情景化運(yùn)營(yíng),事實(shí)上我們身邊許多數(shù)據(jù)換一種解讀模式,通過(guò)與設(shè)備或人建立關(guān)系,也可以發(fā)揮它的價(jià)值。比如氣象、旅游、物聯(lián)網(wǎng)等等。
今年TalkingData與康師傅聯(lián)合打造“做有溫度的零售店”,圍繞消費(fèi)者洞察和購(gòu)物歷程,開(kāi)展了人(客戶(hù)洞察、客戶(hù)情緒畫(huà)像)、貨(IOT技術(shù)、產(chǎn)品洞察)、場(chǎng)(內(nèi)場(chǎng)數(shù)據(jù)、外場(chǎng)數(shù)據(jù))三者之間互動(dòng)關(guān)系分析,打造了快消品企業(yè)首個(gè)運(yùn)營(yíng)4P模型(客戶(hù)、產(chǎn)品、場(chǎng)景和定價(jià)的有機(jī)聯(lián)動(dòng))幫助零售店理解“我的到店顧客是誰(shuí)?”、感知“店內(nèi)顧客和商品溫度如何?”,探求零售背后的營(yíng)銷(xiāo)真相。
數(shù)據(jù)的價(jià)值挖掘,場(chǎng)景是關(guān)鍵,而場(chǎng)景從那里來(lái),除了數(shù)據(jù)分析師大開(kāi)腦洞外,我們更需要結(jié)合行業(yè)伙伴的能力一起探索。TalkingData始終懷揣開(kāi)放的心態(tài),無(wú)論技術(shù)還是知識(shí)我們都愿意與合作伙伴共享。今年我們推出了與GoogleAwareness API無(wú)縫兼容的智能設(shè)備情境感知框架Myna,并且將此作為開(kāi)源產(chǎn)品發(fā)布。
Myna可以調(diào)用設(shè)備的數(shù)據(jù)和傳感器來(lái)檢測(cè)用戶(hù)所處的狀態(tài)與情景,包括時(shí)間、位置(經(jīng)緯度)、地點(diǎn)、活動(dòng)、beacons信標(biāo)、耳機(jī)(插入/拔出)和天氣等。我們希望最大力度的推動(dòng)數(shù)據(jù)的智能化能力,幫助更多的企業(yè)用數(shù)據(jù)做決策;我們也希望攜同更多企業(yè)一同致力于通過(guò)數(shù)據(jù)改善人類(lèi)自身及環(huán)境。
責(zé)任編輯:陳近梅