
有些痛苦從來都與我們?nèi)缬半S行,比如數(shù)據(jù)的質(zhì)量和成本問題。當(dāng)SearchCIO.com就當(dāng)前在大數(shù)據(jù)和云計(jì)算的時(shí)代背景下BI(商業(yè)智能)面臨的新挑戰(zhàn)訪問兩位專家時(shí),發(fā)現(xiàn)這兩個(gè)問題依然是業(yè)界關(guān)注的焦點(diǎn)。
“無論數(shù)據(jù)的規(guī)模大小和新舊程度如何,BI面臨的最大挑戰(zhàn)可能還是數(shù)據(jù)本身的質(zhì)量。”Gartner的著名分析師Bill Hostmann表示。
BI專家Boris Evelson是Forrester Research Inc.的高級(jí)分析師,他基于其在該領(lǐng)域數(shù)十年的經(jīng)驗(yàn)來闡述觀點(diǎn):“現(xiàn)在的數(shù)據(jù)質(zhì)量和30年前一樣糟糕。而提升數(shù)據(jù)質(zhì)量主要是個(gè)經(jīng)濟(jì)問題,相應(yīng)的成本還是太高了。”
如今的CIO們可能對(duì)數(shù)據(jù)質(zhì)量的理解更為深刻,而且手頭也有更多的工具來提升數(shù)據(jù)質(zhì)量。有人認(rèn)為基于云的BI產(chǎn)品有助于成本的降低,但是我們的專家卻對(duì)云計(jì)算和數(shù)據(jù)質(zhì)量之間的相關(guān)性提出了質(zhì)疑。數(shù)據(jù)質(zhì)量方面的問題核心在于數(shù)據(jù)總是處在變化之中:新系統(tǒng)的上線以及新數(shù)據(jù)源的涌現(xiàn)。而數(shù)據(jù)的規(guī)模也在急劇膨脹,比如事務(wù)日志、來自于傳感器的數(shù)據(jù)、點(diǎn)擊流量以及Hostmann特別指出的“社交媒體導(dǎo)致的信息爆炸”。
與此同時(shí),除了數(shù)據(jù)之外其他事情也在發(fā)生變化。BI已經(jīng)從由IT部門單獨(dú)掌控變?yōu)檎麄€(gè)企業(yè)全員參與。而且,數(shù)字質(zhì)量本身的定義也不是一成不變的。因此,對(duì)于CIO來說,真正要面對(duì)的問題應(yīng)該是:就當(dāng)前的工作來說,什么樣質(zhì)量的數(shù)據(jù)是合格的?
“對(duì)信息提供者談數(shù)據(jù)質(zhì)量并沒有太大意義。”Hostmann說:“真正重要的是信息的使用者在基于數(shù)據(jù)進(jìn)行分析或決策時(shí)的滿意度,他們的期望才是問題的核心所在。”
數(shù)據(jù)的質(zhì)量取決于提問人的身份、問題的急迫性以及愿意為之付出的成本。人們?cè)絹碓揭庾R(shí)到建議單一的評(píng)判體系是不現(xiàn)實(shí)的。Evelson表示:“質(zhì)量是相對(duì)的,和具體語境有關(guān)。”
數(shù)據(jù)質(zhì)量滿意度的季度調(diào)查
既然數(shù)據(jù)質(zhì)量是相對(duì)的,并且讓用戶可接受是BI的一個(gè)重要方面,那么對(duì)此CIO們?cè)撊绾螒?yīng)對(duì)呢?
Hostmann對(duì)其客戶的建議是,通過對(duì)企業(yè)內(nèi)關(guān)心數(shù)據(jù)質(zhì)量的決策人進(jìn)行例行調(diào)查,以此建立數(shù)據(jù)質(zhì)量的評(píng)判體系。Gartner使用一套簡(jiǎn)單的工具來評(píng)估用戶對(duì)BI數(shù)據(jù)的滿意度,以及客戶基于數(shù)據(jù)進(jìn)行商業(yè)決策的能力。調(diào)查結(jié)果應(yīng)該每個(gè)季度進(jìn)行一次更新,因?yàn)閿?shù)據(jù)質(zhì)量的定義也在變化中。
找到合適的主導(dǎo)人
在企業(yè)不同業(yè)務(wù)單元之間,這類調(diào)查的結(jié)果會(huì)大相徑庭,從而導(dǎo)致關(guān)注的熱點(diǎn)游離不定。這樣就帶來了一個(gè)問題:哪方面數(shù)據(jù)的質(zhì)量對(duì)于企業(yè)戰(zhàn)略目標(biāo)有著最大的影響?Hostmann認(rèn)為這個(gè)問題主要取決于經(jīng)濟(jì)方面的考慮,但是確定各個(gè)問題的優(yōu)先級(jí)卻不是技術(shù)人員的責(zé)任:“應(yīng)該由業(yè)務(wù)負(fù)責(zé)人來下結(jié)論,但是這其中存在極大挑戰(zhàn)。”
“IT對(duì)數(shù)據(jù)并沒有控制權(quán)。”Evelson認(rèn)為。和其他的企業(yè)應(yīng)用不同,BI從本意上來說就需要由業(yè)務(wù)端來主導(dǎo)。IT團(tuán)隊(duì)有能力為企業(yè)構(gòu)建系統(tǒng)來定義如IBM一樣的龐然大物,但是值得與否需要由其他人來決定。“這肯定不是IT的職責(zé)。”Evelson認(rèn)為:“因?yàn)檫@是整體戰(zhàn)略級(jí)別的決策。”
不同用戶需要不同的工具
基本上,CIO們?cè)谡{(diào)查數(shù)據(jù)質(zhì)量滿意度時(shí)會(huì)發(fā)現(xiàn)用戶大致可以分為高級(jí)和低級(jí)兩類,其中后者可能對(duì)自己的無知都一無所知。數(shù)據(jù)發(fā)掘工具(Data discovery tools)對(duì)低級(jí)用戶來說非常適用,可供挖掘隱藏的數(shù)據(jù)之間的關(guān)系,而且也比較便宜。“無需多維數(shù)據(jù)庫(multidimensional databases)你也可以對(duì)外提供海量數(shù)據(jù),用戶自己通過工具能進(jìn)行分析。”Hostmann說。
高級(jí)用戶一般來自于財(cái)務(wù)部門或者那些受到嚴(yán)格監(jiān)管的行業(yè)。他們清楚地知道自己想要什么,而且可以發(fā)現(xiàn)數(shù)據(jù)質(zhì)量的問題。但是,是否修正問題就得看情況了。比如,要修正對(duì)于“客戶”一詞的定義就需要對(duì)系統(tǒng)大動(dòng)干戈 – 從而又一次導(dǎo)致成本的問題。“雖然看到了問題,但是他們到底愿意花多少錢來解決問題呢?”Hostmann質(zhì)疑到。
Evelson認(rèn)為,即使成本問題得到解決,也不能期望質(zhì)量問題就不復(fù)存在了。CIO們幾乎肯定會(huì)遇到這種問題:首席財(cái)務(wù)官、首席營銷官和銷售副總裁對(duì)于客戶利潤率的定義各執(zhí)一詞。“這會(huì)導(dǎo)致IT無所適從。”Evelson表示。最后,再重申這一點(diǎn):有些痛苦永遠(yuǎn)不會(huì)散去。
CIO頻道人物視窗
CIO頻道方案案例庫
大數(shù)據(jù)建設(shè)方案案例庫
電子政務(wù)建設(shè)方案案例庫
互聯(lián)集成系統(tǒng)構(gòu)建方案案例庫
商務(wù)智能建設(shè)方案案例庫
系統(tǒng)集成類軟件信息研發(fā)企業(yè)名錄