
數據集成是商業智能(BI)流程的關鍵組成部分,可將來自多個源系統的數據進行整合,并將它們合并到數據倉庫以作分析。不過,對于BI數據集成策略,數據管理分析師提醒從業者不可掉以輕心;一旦設計執行不得當,策略很容易就會出現漏洞。
美國Intelligent Solutions咨詢公司的總裁Claudia Imhoff說,數據必須及時上傳到數據倉庫為BI計劃所使用,若時機不當,所有的工作就會毀于一旦。由于有些用戶需要對數據進行實時處理,這就要求BI和數據集成團隊充分理解企業的BI需求。
Imhoff提到,數據質量非常重要,對不良數據進行校對與清理不應該只是BI數據集成流程的專有功能。“錯誤無處不在,我們需要找出它們的來源。”只有這樣,我們才能從一開始就預防源系統的數據錯誤。實際上,合并錯誤數據本來就是數據集成和BI專家們工作的一部分,所以出了紕漏他們是要負責任的。她說:“我們需要讓員工明白,他們的任務不僅僅是做一個傳輸者。”
Gartner分析師Ted Friedman認為,BI數據集成存在的最大問題就是人們對數據質量的關注度不夠。“我已經從事數據集成工作超過十年之久了,但還是要花很多精力去說服企業,讓他們了解BI的作用和價值,使他們接受并信任自己的BI決策,這主要是由于他們還沒找到正確的方法保證數據的質量。”
Friedman說,對于“倔強”的企業,數據質量問題的負面影響不僅僅在于BI方面,但糟糕的數據質量絕對是BI項目獲得成功實施的主要障礙之一。企業在將信息載入到數據倉庫的過程中,從頭到尾都忽視數據的質量、發現問題后也不采取任何減緩措施就會造成這樣的局面。
James Kobielus曾在Forrester公司擔任分析師,今年初跳槽到了一家技術供應商。他指出,數據質量方面的失誤已經成了BI數據集成工作中普遍存在的問題。
Kobielus曾說過:“企業總以為把后臺應用程序中的數據導入數據倉庫以后,不需要做任何清理、匹配、融合或者轉換工作就可以直接使用。”這樣一來,公司總會碰到各種各樣出其不意的問題。例如,“同一個名下出現六條記錄,沒人知道哪條才是正確的。”
BI數據集成的影響力不可小覷
Baseline Consulting公司的創始人之一Jill Dyche稱,還有一個造成數據不一致而產生負面影響的原因,就是企業內部對記錄系統結構存在分歧。打個比方,工作人員無法確定哪一個交易系統應該用作客戶地址信息源。這樣的爭論通常涉及“地址”的定義——在各不相同的情況下,到底以客戶的賬單地址為準?還是送貨地址?抑或是公司地址?
Dyche說:“就這樣,論戰相繼而發,于是業務人員開始懷疑BI團隊對于正確數據的理解及傳輸能力。然后,有人就會建議干脆把全部信息丟進一個數據庫里,可業務人員又不愿意這么做。”
9sight Consulting公司的創始人Barry Devlin認為,在制定BI數據集成的策略與方案過程中,員工不會造成什么太大的失誤。“他們是業務團隊中一個特殊的群體,擁有多年的數據處理經驗,對數據理解頗深;他們是十足的專家和達人。”因此,對于數據如何進行集成、怎樣生成高效的BI應用程序,他們擁有最佳決定權。
Devlin說,盡管如此,IT部門員工在大多數時候不僅負責實施工作,還需要改進數據集成方案。在Devlin看來,雖然IT專業人士可能對企業數據有著很好的理解,但他們還不能稱其為真正的專家。他說,使這兩個團隊聯合起來共同完成BI數據集成困難重重,卻別無選擇。
Imhoff稱,目前一些企業對BI毫無經驗可言,也不具備滿足BI項目數據集成需求的能力,卻急于達成目標,制定出不切實際的計劃。然而,對數據進行集成并上傳到數據倉庫這一流程占據了整個BI項目60%到80%的工作量。如果一個項目團隊想要一次完成所有的工作,那么他們不久后就會以失敗告終。她認為這樣的趨勢正在愈演愈烈,于是告誡道:“不要指望一口吃成一個胖子。”
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄