
商業智能主動幫助企業理解無數的數據點、將眾多數據庫字段轉化為用于推動業務的可行信息。但是,并不是每個BI戰略都能如想象中那么成功——往往因為沒有從高質量的數據入手。
不一致的數據可以有許多形式。你可能有一些數據階層,就像在威斯敏斯特學院里我們一些數據的案例那樣。當你剝開層你會發現,可以根據隨時間推移而造成的信息變化方式,確定組織歷史上的關鍵時刻。在分析我們的籌款數據里,我們追溯到13年前并發現約4個不同的層的數據。在每一層中數據是完全不同的,就跟不同的副總裁來了又離開了一樣。
對于正在進行的報告和智能需求,這是一個遠離理想的情況,有可能損壞決策。這里有各種解決方案。
創建轉換矩陣
幸運的是,即使有四套不同的代碼和數據層,每一層內的所有數據是一致的。因此,創建一個轉換矩陣從各個單獨的層進行數據映射,使報告和情報系統使用一個共同的、易于理解的數據集。所以一些集成數據倉庫的BI系統可以作為配置的一部分。
當然,用這種方法有潛在的缺陷:您可能會在每一層內遇到前后矛盾的代碼,但你也許可以建立轉換矩陣條目來處理這些缺陷,或者你可以在每一層內重新編寫不一致的代碼。
清理歷史數據
一個潛在的更清楚——但非常困難——處理不一致數據的方式是回查歷史數據,并進行數據清理,以便數據從開始到結束都是一致的。這是一個一次性的努力成果,可以簡化正在進行的報告和智能工作。然而,歷史數據的清理也是一項艱巨的任務,必須格外小心。作為這種努力成果的一部分,你很有可能一直需要在某個地方創建一個轉換矩陣。
在威斯敏斯特,我們已經結合了這些方法。由于嚴重的數據質量問題、正在進行報告的困難和業務流程的挑戰,我們遷移到了一個新的籌款信息系統,最終目標是重新編碼并且使我們歷史籌款的所有信息一致。我們的BI戰略包括創建轉換矩陣,并且已經使我們籌款數據標準化。我們現在與其他地區的校園一起享受更好的整合機會,帶來改進以及更有效的業務流程和報告結果。
缺少高質量的數據
許多BI工作有多種用途。你通常要為當前的環境提供一個一目了然洞察能力,可能需要根據歷史表現,排列當前運營。你也想建立預測模型,它可以幫助你更好地根據實際歷史表現衡量未來工作的成果。每個目標都需要歷史數據和當前數據。當前數據很容易收集——只要它在某個地方能被捕獲。如果沒有,你需要確定一個數據位置或者創建一個字段,并制定信息捕獲的流程,然后你必須走出去并捕獲到它。這很容易做到。
然而,歷史數據的缺乏對你的BI戰略來說是一個嚴重的問題。
的確只有兩個辦法可以解決缺少歷史數據。對于大多數的統計模型,在得出任何一種合理的推論之前,都至少需要有三個一致的有充足質量的數據點——例如,具有三年價值的信息的。如果必要的信息存在,但尚未成為你可操作數據庫的一部分,做一個審核——追溯過去并將信息送入適當的位置。
我們現在在威斯敏斯特有一個BI工具可以根據我們選擇的任何因素。幫助我們預測學生的成功——保留。我們愿意考慮參與活動,只要我們發現有可能在某些活動和學生的成功之間可能存在一個正相關關系。我們有一些學生活動的紙質記錄,但這些活動還沒有成為學生電子記錄的一部分。為了作為一個標準來使用,我們要追溯具有三年價值的紙質檔案,并將信息輸入數據庫,然后為BI策略工具創建數據點。
伺機而動的BI策略
另外,如果不能創造歷史數據,我們可以簡單地等待,直到我們有足夠開始繪制基于信息結論的數據點。這是一個低技術要求的解決方案,將極大地依賴于必須的時間框架來收集一靠的樣本數據集。
雖然這不是沒有高質量數據,BI工作中任何十二都可能出錯的詳盡清單,請大包記住:許多數據質量問題是可以調整的,無論是通過大量的手動工作或只是在等待收集達到你標準的高質量數據。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄