
數據倉庫引擎是BI中的核心,它的性能高低直接決定了BI的表現。
一個完整的BI(Business Intelligence)應用通常涉及數據倉庫引擎及其相關的設計建模工具、ETL工具、前端展現工具等。這里的數據展現主要作用是以圖表、Dashboard等形式將結果呈現給用戶;ETL負責將原始數據進行抽取、轉化、清洗、裝載進數據倉庫;數據倉庫負責執行數據的存儲和管理,并執行前端展現工具提交的各種查詢分析任務。在BI應用中,數據倉庫類似于汽車的引擎,居于核心地位,它的性能高低直接決定了BI應用的響應速度。而在大型BI應用中,性能是一個非常關鍵的問題,特別是那些有著海量數據、需要完成復雜查詢任務的系統,數據倉庫引擎的選擇就更為關鍵。
不同的技術路線
綜觀目前的數據倉庫市場,能提供這一個工具的供應商并不多,一線的廠商主要有Teradata、IBM、Oracle、Sybase、Microsoft等。盡管同為數據倉庫引擎,但是這些供應商各自所走的技術路線并不同,不同的技術也導致了它們的產品具有完全不同的特點。
Teradata應該算最為特立獨行的一個。Teradata數據倉庫主要運行在NCR WorldMark SMP硬件的Unix操作系統平臺上(該公司也提供基于Windows NT的Teradata),它的高性能主要通過Teradata與NCR硬件平臺海量并行處理服務器(Massively Parallel Processing, MPP)結合,以及采用特有BYNET協議和查詢優化等技術實現并行等機制來實現。由于采用一些專有的硬件和技術,因此,價格較高,是數據倉庫中的貴族。
IBM、Oracle和Microsoft的數據倉庫引擎屬于同一類,它們都提供數據庫產品,其數據倉庫引擎和數據庫引擎從技術上說有很多相似之處。這種技術路線給它們帶來的好處是,其數據倉庫解決方案很自然地從數據庫技術拓展和延伸而來,集成性、延續性比較突出。
與IBM、Oracle等相比,雖然Sybase也同時提供數據庫和數據倉庫產品,但是,其Sybase的數據倉庫引擎卻走了一條與其數據庫、也與Oracle、IBM完全不同的技術路線。其中最大的不同就是在Sybase數據倉庫引擎(即Sybase IQ)中采用列存儲架構,而所有關系型數據庫引擎廣泛采用的則是行式存儲。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄