
有句老話說,人一胖他就喘,而企業一旦有了很多數據,就想做些分析。前幾年,數據倉庫項目先是在電信、金融行業廣泛開展;近兩年,在零售、制造業中也不斷傳來建設數據倉庫的消息。這就是因為這些企業已經沉淀了足夠數據的緣故。
當然,有些企業是出于經營分析的需要,有的企業則可能是看著競爭對手上了個數據倉庫,唯恐自己落后緊趕著上的。而不管如何,當企業開始它們首個數據倉庫(或稱商務智能)項目時,大都會被一個問題困擾——應該使用什么樣的產品組合。
“洋玩意兒”何其多
在選型之前,不妨數數現有的BI主流產品都有哪些。
數據庫方面,有DB2、Oracle、SQL Server、Teradata,早先還有專門用于數據倉庫的Redbrick(被IBM收編以后,退出歷史舞臺)。
ETL工具上,像Datastage、Powercenter都是比較主流的,此外,還有很多公司也有自己的ETL產品,例如SAS的ETL Server、BO的Data Integrator等。
OLAP 工具上,則還可以細分為MOLAP(MuiltDimension OLAP,多維度型在線分析系統)和ROLAP(Relational OLAP,關系型在線分析系統),前者可以選擇Hyperion、Cognos、Microsoft公司的產品,而后者可供選擇的余地就不多,像 Microstrategy可能是目前能夠看得見市場份額比較大的,以前和Redbrick一起。此外,還有一個叫Metacube的ROLAP工具,早在2000年以后也退出市場。
數據挖掘產品領域,有SAS、SPSS等兩大廠家,而像IBM、Teradata也都有自己的挖掘工具。除此之外,在報表服務器、前端工具上的選擇可就多了,其中,Cognos、BO、Brio是比較主流的。
從這些主流產品來看,大多是舶來品。國內也有研發BI產品的,但多限于ETL、前端以及數據挖掘產品。這種局面和國內以往的產品選型有著莫大關系,因為在這三塊領域很多項目都曾經自主從頭開發過。
說的要比唱的好
從目前各類用戶的產品選型過程來看,問題多出在以下幾個方面。
其一,只見樹木不見森林,只顧得降低單個工具的成本,卻忽視了總體成本。有些大企業在IT建設上一擲千金,從不在乎在購買產品上投入多少,每一塊都是選用最好的。但是,更多的企業則不得不出于成本考慮,能省則省。除了數據庫和OLAP工具兩項之外,經常動心思的地方就是,設想如果把ETL和前端展現自己來開發是不是會省點資金出來。
然而問題是,如果僅僅從單個產品的成本考慮而忽視綜合的項目成本,最后很可能會被難以維護的程序所困擾,甚至要完全推翻重來,這樣的成本恐怕會更高。而對于那些財大氣粗的大企業來說,即便選擇了每個領域最好的產品,組合起來也不一定就是最好的。
其二,全方位解決方案并不受待見。如今幾乎每家公司都號稱可以提供全方位解決方案,提供一站式服務。像IBM、Oracle、SAS都稱自己是這樣的全方案提供商,也就是說它們的產品線已經包含了數據庫、OLAP、ETL等各類工具。直接選用它們,就不用再為工具選型煩惱了。事實上,這樣的廠家還在漸漸增多,它們有的靠OEM專業產品,有的則直接購并專業工具廠商。
選擇這樣的產品組合可能是明智的,然而在國內還沒有完全能夠吃得開。因為中國人講究制衡,所有的蛋糕都給你一家拿去了,以后你跩起來,我豈非很被動?因此,通常還是要引入多家原廠商,讓它們合作并競爭著吧。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄