來源:品覺 時間:2017-06-02 11:21:37 作者:車品覺
由于不同類型的非結(jié)構(gòu)化數(shù)據(jù)和多種格式的數(shù)據(jù)從傳感器、網(wǎng)絡(luò)以及傳統(tǒng)數(shù)據(jù)庫大量涌入,這使得數(shù)據(jù)整理變得更加困難。必須先對這些數(shù)據(jù)進(jìn)行清理和組織,然后才能使用數(shù)據(jù)分析工具。這就是自動化工具的用武之地。自動化和人工智能可以幫助整理不同來源的數(shù)據(jù),然后把經(jīng)過整理的數(shù)據(jù)以圖表方式呈現(xiàn)。
數(shù)據(jù)協(xié)調(diào)把數(shù)據(jù)和需求聯(lián)系起來,從而提高了企業(yè)數(shù)據(jù)的質(zhì)量和效用。它還可以讓企業(yè)用戶在無需IT參與的情況下,轉(zhuǎn)換數(shù)據(jù),并建立新的數(shù)據(jù)分析和可視化分析。提高了企業(yè)數(shù)據(jù)的質(zhì)量和效用,有助于迅速部署新的先進(jìn)技術(shù),比如機(jī)器學(xué)習(xí)、人工智能和物聯(lián)網(wǎng),而且費(fèi)用不高。
原文翻譯:
數(shù)據(jù)協(xié)調(diào)是提高數(shù)據(jù)質(zhì)量的一種方法,旨在改善企業(yè)治理和數(shù)據(jù)的有效性。這是如何做到的?企業(yè)應(yīng)該如何實(shí)施數(shù)據(jù)協(xié)調(diào)策略?
為了解答這些問題,我們采訪了Absolutdata聯(lián)合創(chuàng)始人兼CEO阿尼爾·考爾(AnilKaul)??紶柋辉u為印度十大最具影響力的數(shù)據(jù)分析領(lǐng)袖之一。他在數(shù)據(jù)分析、市場研究和管理咨詢方面擁有二十多年的從業(yè)經(jīng)驗(yàn),曾獲得康奈爾大學(xué)市場營銷碩士和博士學(xué)位,也是一位備受尊敬的作家和演講者。
以下是經(jīng)編輯整理的采訪實(shí)錄。
問:你對數(shù)據(jù)協(xié)調(diào)的定義是什么?
答:簡單來說,數(shù)據(jù)協(xié)調(diào)在于創(chuàng)造一個單一的真相來源,方法是從不同的來源獲取數(shù)據(jù),去除具有誤導(dǎo)性或者不準(zhǔn)確的數(shù)據(jù),并以整體方式來呈現(xiàn)數(shù)據(jù)。這意味著,你會得到一個可以觀察一切的窗口,為決策提供支持,包括財(cái)務(wù)信息和企業(yè)表現(xiàn)。數(shù)據(jù)的來源雖然不同,但經(jīng)過協(xié)調(diào)后,數(shù)據(jù)就會被整理、分類和匯總,為你提供全面的視野。
問:按照Informatica對數(shù)據(jù)協(xié)調(diào)的定義,機(jī)器學(xué)習(xí)是這一過程的重要組成部分。在數(shù)據(jù)協(xié)調(diào)的過程中,機(jī)器學(xué)習(xí)等智能數(shù)據(jù)工具和人工智能扮演了什么樣的角色?
答:機(jī)器學(xué)習(xí)是一種數(shù)據(jù)分析方法,可以使分析模型的構(gòu)建實(shí)現(xiàn)自動化。利用從數(shù)據(jù)中迭代學(xué)習(xí)的算法,機(jī)器學(xué)習(xí)能夠讓電腦發(fā)現(xiàn)隱藏的規(guī)律,而不必通過具體的編程來實(shí)現(xiàn)。
可用數(shù)據(jù)的體量越來越大、類型增多,加之計(jì)算處理能力越來越便宜,數(shù)據(jù)存儲和挖掘能力日益強(qiáng)大、實(shí)惠,這使得在短時間內(nèi)自動構(gòu)建模型成為可能,從而讓我們有能力分析更龐大、更復(fù)雜的數(shù)據(jù),并更快得出更準(zhǔn)確的結(jié)果——哪怕數(shù)據(jù)規(guī)模非常之大,也能做到。通過建立精確的模型,企業(yè)更有可能發(fā)現(xiàn)機(jī)遇,或者避免風(fēng)險(xiǎn)。機(jī)器學(xué)習(xí)工具和人工智能在這方面提供了支持。
由于不同類型的非結(jié)構(gòu)化數(shù)據(jù)和多種格式的數(shù)據(jù)從傳感器、網(wǎng)絡(luò)以及傳統(tǒng)數(shù)據(jù)庫大量涌入,這使得數(shù)據(jù)整理變得更加困難。必須先對這些數(shù)據(jù)進(jìn)行清理和組織,然后才能使用數(shù)據(jù)分析工具。這就是自動化工具的用武之地。自動化和人工智能可以幫助整理不同來源的數(shù)據(jù),然后把經(jīng)過整理的數(shù)據(jù)以圖表方式呈現(xiàn)。
人工智能可以使數(shù)據(jù)準(zhǔn)備和協(xié)調(diào)變得更加容易,從而加快大數(shù)據(jù)技術(shù)的普及。來自物聯(lián)網(wǎng)等新興網(wǎng)絡(luò)來源的數(shù)據(jù)種類越來越多,這使我們更加渴望得到更多、更好的自動化工具。
問:數(shù)據(jù)協(xié)調(diào)是否只是主數(shù)據(jù)管理的另一種說法?二者之間有什么重要區(qū)別?
答:主數(shù)據(jù)管理主要是管理被多個IT系統(tǒng)和群組所共享的引用數(shù)據(jù)或者主數(shù)據(jù),能夠提供對核心數(shù)據(jù)儲存庫的訪問。它還通過關(guān)注業(yè)務(wù)流程、數(shù)據(jù)質(zhì)量以及信息系統(tǒng)的標(biāo)準(zhǔn)化和整合,來解決數(shù)據(jù)問題。數(shù)據(jù)協(xié)調(diào)則是之前進(jìn)行的一步,涉及數(shù)據(jù)的清理,去除多來源數(shù)據(jù)的不一致性和不準(zhǔn)確性,試圖讓不同來源的數(shù)據(jù)“和諧相處”,提供全面統(tǒng)一的視野。數(shù)據(jù)協(xié)調(diào)過程如同把一塊塊的拼圖拼接起來,在此過程中,不同的數(shù)據(jù)元素和變量被識別、清洗和處理,然后形成一個有利于決策的數(shù)據(jù)儲存庫。
問:數(shù)據(jù)協(xié)調(diào)的主要好處是什么?
答:數(shù)據(jù)協(xié)調(diào)把數(shù)據(jù)和需求聯(lián)系起來,從而提高了企業(yè)數(shù)據(jù)的質(zhì)量和效用。它還可以讓企業(yè)用戶在無需IT參與的情況下,轉(zhuǎn)換數(shù)據(jù),并建立新的數(shù)據(jù)分析和可視化分析。你不必去想你是否把握了全局。你可以完全依靠數(shù)據(jù)提供的真相,作出更明智的決定。
簡單來說,數(shù)據(jù)協(xié)調(diào)提高了企業(yè)數(shù)據(jù)的質(zhì)量和效用,有助于迅速部署新的先進(jìn)技術(shù),比如機(jī)器學(xué)習(xí)、人工智能和物聯(lián)網(wǎng),而且費(fèi)用不高。
有了一個定期或?qū)崟r更新的真相來源,就不需要花時間去核實(shí)、重新校驗(yàn)和追溯數(shù)據(jù)的多個來源。信息就在那里,你可以據(jù)此作出決策。這將使你的公司更加靈活,對市場變化的反應(yīng)更加迅速。數(shù)據(jù)協(xié)調(diào)大幅縮短了發(fā)現(xiàn)和獲取商業(yè)智能洞見所需要的時間,同時降低了數(shù)據(jù)分析的總體成本。
假設(shè)你在一個團(tuán)隊(duì)中開始使用經(jīng)過協(xié)調(diào)的數(shù)據(jù)。隨著系統(tǒng)的演化,積累了更多的相關(guān)數(shù)據(jù),它可以較快地把這個過程復(fù)制到其他業(yè)務(wù)領(lǐng)域。隨著使用量和采用量的增加,該系統(tǒng)會變成一個巨大的知識庫。
問:數(shù)據(jù)協(xié)調(diào)過程應(yīng)該如何開始?要想恰當(dāng)?shù)貙?shí)施,需要哪些基本步驟?
答:數(shù)據(jù)協(xié)調(diào)過程應(yīng)從確定目標(biāo)開始。然后,再制定協(xié)調(diào)和研究方案來實(shí)現(xiàn)這些目標(biāo)。還要設(shè)計(jì)一個針對IT系統(tǒng)和所需元素的架構(gòu),啟動數(shù)據(jù)整合和協(xié)調(diào)過程。實(shí)施的基本步驟包括:
第1步:識別微數(shù)據(jù)的相關(guān)來源,進(jìn)行數(shù)據(jù)收集和獲取,形成數(shù)據(jù)集。
第2步:清理和協(xié)調(diào)。數(shù)據(jù)清理過程包括識別不正確、不準(zhǔn)確或不一致的數(shù)據(jù),并加以修改。這是為了提高數(shù)據(jù)質(zhì)量,形成干凈、統(tǒng)一、一致的數(shù)據(jù)集以供協(xié)調(diào)。
第3步:對數(shù)據(jù)進(jìn)行質(zhì)量檢查,確保數(shù)據(jù)達(dá)到可接受的完整性和有效性水平。檢查是否存在重復(fù)的數(shù)據(jù)錄入以及不一致或不適用的數(shù)據(jù)。
第4步:變量被識別并被挑選出來進(jìn)行協(xié)調(diào)。這會相當(dāng)棘手,因?yàn)椴煌瑏碓吹淖兞繒r常會前后不一致。必須在實(shí)用性(找到類似并共同發(fā)揮作用的信息)與純凈性(完全一致的信息)之間找到一種平衡。
第5步:數(shù)據(jù)被處理,必要時將其轉(zhuǎn)換成常見格式,并實(shí)現(xiàn)共享?,F(xiàn)在,公司的各個部門都能訪問同樣的最新數(shù)據(jù)。數(shù)據(jù)可以按照各個部門的不同需求,進(jìn)行過濾和呈現(xiàn)。
通過最終檢查后,數(shù)據(jù)被存儲起來,在需要時使用。經(jīng)過協(xié)調(diào)的數(shù)據(jù)并非靜止不變,而是會定期或?qū)崟r更新,以確保數(shù)據(jù)能用于解決各種問題。
問:對于一家正在探索數(shù)據(jù)協(xié)調(diào)各種可能性的公司,你有什么建議?
答:數(shù)據(jù)協(xié)調(diào)就是未來,因?yàn)樗鼮橛行У臄?shù)據(jù)處理和決策提供了補(bǔ)充和支持,從而確保了數(shù)據(jù)的準(zhǔn)確性和可靠性。今后幾年,數(shù)據(jù)協(xié)調(diào)將成為企業(yè)實(shí)現(xiàn)高效與成功的必需品。
數(shù)據(jù)協(xié)調(diào)不止是縫隙填充物。它有助于把各種數(shù)據(jù)元素和變量無縫地結(jié)合起來,變成一個按功能使用的數(shù)據(jù)集。完全不同、毫不相關(guān)的數(shù)據(jù)需要我們花時間去處理,因而拖慢了決策過程,且缺乏準(zhǔn)確性。但現(xiàn)在,通過數(shù)據(jù)管理和數(shù)據(jù)協(xié)調(diào),企業(yè)能夠作出適當(dāng)、最優(yōu)化的決策,從而以靈活的姿態(tài)脫穎而出,領(lǐng)先于競爭對手。
…
數(shù)據(jù)協(xié)調(diào)的作用顯而易見,但談到具體的實(shí)施方法,很多人并不清楚??紶柕奈鍌€步驟為那些有意從事數(shù)據(jù)協(xié)調(diào)的企業(yè)提供了堅(jiān)實(shí)的基礎(chǔ)。數(shù)據(jù)協(xié)調(diào)能帶來諸多好處,包括能更迅速地獲得更好的商業(yè)智能洞見。不過,在實(shí)施每一步的過程中,每家企業(yè)都會有各自的方法來實(shí)現(xiàn)數(shù)據(jù)協(xié)調(diào)。即便如此,任何旨在發(fā)現(xiàn)“單一真相來源”的方法必定都值得我們?nèi)ヌ剿鳌?/p>
責(zé)任編輯:陳近梅