
數據挖掘(DM)
數據挖掘,也可以稱為數據庫中的知識發現(KDD,Knowledge Discovery in Database),是從大量數據中提取出可信、新穎、有效并能被人理解的模式的高級處理過程。數據挖掘是一種決策支持過程,它從大量的數據中提取隱含的、潛在的、以前未知的有用信息或模式。它主要基于人工智能、機器學習、統計學、數據庫等技術,通過分析大量的原始的數據,作出歸納性的推理,挖掘出潛在的模式并預測客戶的行為,幫助企業的決策者調整市場策略,減少風險,做出正確決策。
上海雙菱空調使用數據挖掘技術,是希望按照企業既定的業務目標,對大量的企業數據進行探索、揭示隱藏其中的規律性并進一步將之模型化的先進、有效的方法。如通過對客戶各種數據深入分析,了解客戶的行為,建立模型,并對客戶未來的行為進行預測。多年來,上海雙菱的統計人員采用手工方式“挖掘”數據庫,尋找統計學上的重要模式。現在,數據挖掘技術被很好地用于為上海雙菱空調預測客戶行為進行建模。預測建??梢詫蛻暨M行分類,同時對客戶的行為進行打分,這些信息可以被整合到數據倉庫和其他市場營銷應用中。
上海雙菱空調采用的數據挖掘分析方法主要有:關聯分析、序列模式分析、分類分析和聚類分析等。數據挖掘利用人工智能領域中一些已經成熟的算法和技術如:人工神經網絡、遺傳算法、決策樹方法、鄰近搜索算法、規則推理、模糊邏輯、公式發現等來進行數據的挖掘。數據挖掘是人工智能中的成熟技術在決策支持系統中的具體應用。
OLAP和數據挖掘是相輔相成的,但它們的側重點不同,OLAP側重于與用戶的交互、快速的響應速度及提供數據的多維視圖而數據挖掘則能自動發現隱藏在數據中的模式和有用信息。OLAP的分析結果可以給數據挖掘提供分析信息作為挖掘的依據,數據挖掘可以拓展OLAP分析的深度,可以發現OLAP所不能發現的更為復雜、細致的信息。從上面的論述可以看出如果將OLAP與數據挖掘相結合將會發揮更好的效用,這是OLAP發展的又一個新方向。
數據挖掘是當前業界的熱門技術,已經在多個應用領域產生了巨大的效益。數據挖掘不一定需要建立在數據倉庫的基礎上,但是,如果將數據挖掘和數據倉庫協同工作,則可以簡化數據挖掘過程的某些步驟,從而大大提高數據挖掘的工作效率。并且,因為數據倉庫的數據來源于整個企業,保證了數據挖掘中數據來源于整個企業,保證了數據挖掘中數據來源的廣泛性和完整性,例如,上海雙菱的信息化數據包括了財務及物流業務的管理領域,數據來源包括了博科、用友、金蝶的軟件系統,以及自主開發的軟件系統。
數據挖掘技術是數據倉庫中應用比較重要也是相對獨立的部分,目前正處在發展不斷當中。數據挖掘涉及到數理統計、模糊理論、神經網絡和人工智能等多種技術,技術含量比較高,實現難度較大。此外,上海雙菱還考慮在以后將數據挖掘技術與可視化技術、地理信息系統、統計分析系統相結合,豐富數據挖掘技術及工具的功能與性能。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄