
四、決策樹技術在汽車銷售中的應用
下面將就某汽車銷售公司,在汽車展上的調查問卷進行分析。

潛在客戶的數據主要有年齡、性別、職業、收入、教育程度、是否結婚,是否有房等,調查客戶是否會在一年內買車。數據表格式如下: 1.數據預處理。數據預處理的目的是為了提高數據質量,使數據挖掘的過程更加有效,更加容易同時也提高挖掘結果的質量。數據預處理的對象主要是清理其中的噪聲數據、空缺數據和不一致數據。常用的數據預處理技術主要包括;數據清洗、相關分析和數據變換等。 數據清洗試圖填補訓練集中的空缺值、識別孤立點、消除噪聲、糾正數據中的不一致。對于空缺值的處理,通常有忽略元組、人工填寫空缺值、使用全局常量填充、使用屬性平均值填充、使用與給定元組同一類的樣本平均值填充、使用最可能的值填充等方法。
調查問卷中有部分沒有填寫的選項,如年齡屬性,對于這一部分記錄采用的是使用屬性平均值填充的方法。在進 行 數 據挖掘工作之前需要進行前期的數據整理工作,比如根據直觀經驗去除數據中的冗余信息或不相關信息,對于上面的數據集中的屬性,像序號等可以在正式開始數據挖掘前去除,因為客戶是否近期內買車是我們最關心的信息我們把屬性是否 一年內買車,即作為類標簽屬性。
2.生成決策樹,產生規則。整理后的數據導入到DB2關系數據庫表中,使用IBM的Intenlig entM iner提供的數據挖掘工具生成決策樹并剪枝后。
3.決策樹結果分析理解。需要說明的是這203份問卷是在車展中獲取的.來參加車展接受問卷調查的自然多數是有買車想法的,因此31.2%愿意買車.這個比例在普通人群中是達不到的。下面我們從產生的決策樹規則分析一下是否在一年內買車與客戶的因素之間的關系。
(1 )收入直接決定了一個人的購買力。salary即月薪在低于2550元的客戶中汽車是奢侈品.在近期一年內沒有購車的意愿;月薪在高于6500元的客戶中,一年內也沒有購車的意愿可以想象高收入人群大多已經有車了。
(2) 年齡也是導致買車的一個因素。在接受調查的人群中都在22歲一65歲之間。年輕人中愿意買車的較多年齡小于31.5歲的人,可能是由于婚姻與購房所困,一年內沒有購車的意愿:年齡在31.5歲一40.5歲之間(占82.3%),一般來說這一部分高收入人群不受房子與婚姻狀況所困擾孩子大多在上中小學.而目前大多數是獨生子女,社會治安又不太好在經濟條件許可的情況,會考慮買車來接送孩子。因此有近期買車的打算。
(3) 愿意買車的多為男性。在低收入的女性中沒有考慮購車問題.但男性如果收入還可以的情況下有近期買車的可能性。
(4) 從目前 這些數據來看受教育情況、婚否、工作性質與是否愿意近期買車影響也不大。客戶的購 買行為還要從多方面進行考慮我們僅從這幾方面挖掘出外部環境與客戶的購買行為之間的關系。在計劃購車的人群中購車的價位,車的排氣量、/車的顏色等也可以進行挖掘在不打算購車的人群中不買的原因,也值得分析。
五、結論
采用決策樹分類算法,通過對調查數據挖掘得到一系列的分類規則,然后利用此分類規則對潛在客戶進行分析采取主動營銷.可以降低營銷成本從而可以提高營銷的成功率。隨著多方面大量數據的獲得,商業智能的數據挖掘工具可以挖掘出更有參考價值、易于理解,并具有很高的分類準確度的規則為生產實踐服務。決策樹數據挖掘技術在汽車銷售中也有著廣闊的應用前景,值得我們進一步的研究。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄