分類回歸樹的服務營銷研究

時間:2022-12-03 03:27:35

導語:分類回歸樹的服務營銷研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

分類回歸樹的服務營銷研究

1引言

新聞具有強大的受眾群體,其本身又囊括了信息、獵奇、教育、娛樂等各個方面的功能,因此已成為一種優勢資源。當今市場競爭日益激烈,傳統的電視廣告早已不能滿足企業營銷的需求,快節奏的生活導致消費者對鋪天蓋地的廣告產生資訊焦慮;而后產生的軟廣告在應用中操作的不到位以及摻雜大量虛假成分導致其隱蔽性慢慢被消費者揭開,傳播效果也大打折扣。此時新聞營銷應時而生,新聞營銷會讓消費者在不知不覺中接受企業要傳播的東西。數字華夏品牌傳播機構認為只要有圖片、音頻、視頻存在,新聞營銷都會大行其道。新聞營銷是指企業在真實、不損害公眾利益的前提下,利用具有新聞價值的事件,或者有計劃的策劃、組織各種形式的活動,借此制造“新聞熱點”來吸引媒體和社會公眾的注意與興趣,以達到提高社會知名度、塑造企業良好形象并最終促進產品或服務銷售的目的[1]。本文針對某企業實施的新聞服務營銷計劃,利用歷史數據挖掘選出更能接受這一營銷模式的潛在客戶,從而為企業更好的制定營銷計劃提供參考。

2數據挖掘概述

數據挖掘中應用最為廣泛的就是分類,分類的優劣可以從以下三個方面進行判別:(1)預測準確度;(2)計算復雜度;(3)模式的簡潔度。決策樹是以事例為基礎的歸納學習算法,利用一系列規則,從一組無序無規則的數據中建立樹狀圖用于分類與預測,常用的決策樹方法有分類回歸樹(ClassificationandRegressionTree,CART)、卡方自動交互檢驗法(Chi-squareAutomaticInteractionDetector,CHAID)等[3]。

3CART樹算法介紹

分類與回歸樹(ClassificationAndRegressionTree,CART)是由Breiman等人在1984年提出的一種產生二叉決策樹的分類方法[4]。分類樹與回歸樹算法的兩個重要思想是:(1)遞歸地劃分自變量空間;(2)用驗證數據進行剪枝。其采用基于最小距離的基尼指數估計函數,這是因為基尼指數可以單獨考慮子數據集中類屬性的分布情況,用來決定由該子數據集生成的決策樹的拓展形狀[5]。C-R樹算法可以對非線性數據序列進行處理。對于一般的時間序列的預測問題,往往可以建立在數據回歸模型基礎之上,擬合自變量與因變量之間的相互關系,從而達到對新數據進行預測的目的。該算法可自動忽略對目標變量沒有貢獻的屬性變量,也為判斷屬性變量的重要性,減少變量數據提供參考。除此之外,在面對諸如存在缺失值、變量數多等問題時C&RT顯得非常穩健,估計模型通常不用花費很長的訓練時間,這些優點都使得分類回歸樹具有廣泛的應用范圍。

4數據挖掘過程

本文應用SPSS公司的商業智能分析軟件Clementine構建分類回歸樹模型,對響應新聞服務營銷的客戶數據進行分析建模。

4.1數據準備

(1)數據庫的建立。本文的數據是某企業442條客戶信息記錄,企業對這442個客戶實施了新聞服務營銷策略并觀察客戶對該策略的反應。客戶信息變量包括性別、年齡、受教育年限、看電視時間、參加的社會團體個數、孩子個數、收入水平以及對該營銷策略的響應等,將數據導入到具有強大數據統計分析功能的SPSS數據庫中,建立一個名為NewsChan.sav的數據庫,即為數據挖掘的數據源。(2)數據預處理。數據預處理主要是數據的清理,目的在于消除或減少數據噪聲以及處理缺失值。例如在本例獲得的客戶信息中,有些客戶某個屬性值缺失,可以運用回歸或決策樹得到最可能的值填充缺失值。數據預處理是數據挖掘過程中必不可少的一個重要環節。圖1是數據處理后在clementine軟件的屬性類型節點定義。

4.2模型建立

主要采用分類回歸樹CART算法建立數據模型,參數設置中基于樹生長的“基尼系統”(GINI)[7]后剪枝策略,設置最大生長層次為5層。建模的過程如圖2所示。

4.3模型運行結果及分析

(1)CART算法模型的運行結果。通過對442條匯總的數據記錄(既作為訓練集又作為預測集)進行分析建模,運行結果如圖3、4所示。(2)潛在客戶特征分析。由得到的C-R樹模型可知,樹從根節點到葉子節點的分支依據都是客戶的屬性變量,因此分析所有從根結點到有潛在客戶標示的葉結點的遍歷過程,可以找出潛在客戶的特征。從模型結果可以看出,大部分分支的結果都是非潛在客戶,只有兩條規則對應的預測結果是潛在客戶:規則一:年齡大于40.5歲。規則二:年齡小于40.5但收入水平在兩千元及以上并且接受教育年限達到12.5年以上以及所參加的社團組織較少的客戶。滿足這些屬性規則的客戶生活水平相對較高,一定程度的教育使得他們更趨向接觸新聞而不是一般的廣告,并有較穩定的消費需求,從而更容易接受新聞服務的營銷模式。非潛在客戶有三條規則,其中一條比較有參考價值,即年齡在40.5歲以下且收入水平不足1000元的群體,在新聞服務營銷研究中這類群體很難成為該營銷方式的受眾。(3)模型評估。在完成基于分類回歸樹算法的建模和結果分析后,將利用預測集的數據來檢驗該模型的準確度,執行數據流的結果評估,如圖5所示。由圖5可知,用CART算法對預測集進行檢測后,此模型的準確率為68.55%,數據為303個,錯誤率31.45%,數據為139個。從模型運行結果分析可以看出模型的結果對市場營銷有一定決策支持的意義。只有數據信息量足夠大,結果的準確率才會越高,而本文中所匯總的客戶記錄數過少。在現實生活中,客戶數據要遠遠大于這些。另外,一些其它的因素,比如客戶的興趣趨向、職業等也都是較為重要的影響因子。由于文中所用的搜集數據缺乏這樣的信息,實際中不同新聞服務營銷的影響因子又各不相同,從而影響了模型結果的準確率,但仍具有一定的參考意義。

5總結

這個例子演示了如何使用C&R樹節點和決策樹的一種營銷研究,以確定哪些客戶將通過電纜訂閱互動新聞服務。使用預測因素,如年齡,性別,教育程度,收入類別,每天看電視的時間,子女數目等,能夠預測和分類這些響應并得到回應率最高的為客戶所利用。分類回歸樹模型易于使用和理解。該系統構建樹和遞歸分割每個分支,直到滿足一個或多個停止標準。然后在每個分割節點,最好的預測是在自動選擇的基礎上所用的建模方法。在這個事例中,可以使用樹生成一個模型或選擇節點適用于未來的數據集,從而達到預測的效果。

本文作者:汪秀工作單位:安徽財經大學管理科學與工程學院