情感分析及軒逸汽車銷售決策

時間:2022-07-26 11:23:23

導語:情感分析及軒逸汽車銷售決策一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

情感分析及軒逸汽車銷售決策

在電商無限發展的今天,面對著龐大、不規則的網絡評論文本數據,如何從中尋找出對企業制作銷售決策有用的信息,已成為當下各大商家的關注熱點。本文就這一問題展開討論,試圖挖掘出對支撐車企制定或改善銷售決策有重要作用的信息。論文主要引用BERT模型并計算相關指標值,同時利用ROSTCM6軟件對負面情感文本進行社會網絡和語義網絡分析。結果表明,超過半數購車車主對軒逸汽車的態度明顯持積極情感,即該品牌汽車得到了多數使用車主的認可。最后,還運用了4Ps營銷理論對情感分析過程中發現的問題進行了總結,并提出相關建議。

1研究背景及意義

在經濟全球化的背景下,隨著人們生活質量的不斷提高,人們對出行的代步工具的需求越來越大,在綜合方便、舒適等條件下,汽車便成為了廣大消費者的最優選擇。據中國汽車工業協會統計數據顯示,2020年汽車產銷分別為2522.5萬輛和2531.1萬輛,產銷量在全球連續領先。據太平洋汽車網銷售統計數據顯示,2020年熱度最高的車型為東風日產系列的軒逸牌轎車,其2020年1~12月總銷量在各大轎車車型中排名第一,在緊湊型車車型中排名第一,綜合太平洋汽車網所提供數據分析,軒逸牌汽車已經受到了廣大消費者的青睞。因此,本文將東風日產系列中的軒逸轎車作為研究對象。論文主要采用數據挖掘技術和數據分析方法,獲取太平洋汽車網上的軒逸轎車論壇相關評論文本信息,并對這些評論文本信息進行預處理后,分析出消費者對該型汽車產品的積極、消極或中性的情感,引用BERT模型算法并進行指標值計算,利用負面情感分析和詞云分析挖掘出消費者對車型本身的關注點,最后結合4P營銷策略和情感分析結果,對車企提出相關建議。論文研究有助于對有購車需求的潛在消費者提供做出購買決策的重要依據;另一方面,還對汽車商家準確把握消費者的情感傾向、改善產品和服務、制定正確的銷售決策和增強企業在行業中的競爭力具有重要的戰略指導意義。

2研究現狀

目前,國內外對情感分析的研究有很多,但大多都更偏向于社交網絡(諸如微博、微信等)的文本情感分析,專門針對汽車行業的研究卻寥寥無幾。根據論文研究內容,由情感分析展開國內外研究現狀的論述。情感分析又稱意見挖掘,是對有感情色彩的主觀性文本進行分析、處理、歸納和推理的過程。在國內,情感分析領域的研究已經取得了巨大成果,有對微博等社交網站評論進行情感分析的,也有對互聯網上某一具體產品的評論文本進行細膩度情感分析的,一些學者更是專門針對汽車領域,就消費者消費價值取向與對汽車產品的情感傾向等問題做出了深入的研究與探討。蘇菊芳通過對圖書館讀者的評論文本進行情感分析,得出圖書館讀者情感極性從而采用本體的形式構建圖書館讀者情感畫像庫,為讀者的個性化推薦提供了新的研究思路,實現了讀者的情感知識語義檢索與共享[1]。楊立公等則以文本顆粒度為視角,從情感詞抽取等五個方面對文本情感分析文獻進行了梳理,并指出了當前情感分析系統準確率不足的問題[2]。王獻偉結合了Spark平臺提出應用文本情感分析來挖掘商品評論中的特征屬性信息,選取了京東商城上行業排名前五的智能冰箱評論作為研究對象,通過對評論語料中智能冰箱各屬性的情感傾向進行分析,獲取各屬性在市場上的褒貶評價[3]。周立柱等則對情感分析的研究對象和目標進行了定義,詳細地回顧和分析了主要的處理方法,簡要的介紹了一些相關的情感分析問題,并對情感分析現有的成就、不足和挑戰進行了總結[4]。王琛則通過獲取了商品以及電影評論數據,提出了Word2vec的情感分析方法,并設計實現了一個在線實時情感分析系統,方便了用戶實時查詢,具有可操作性、準確性、直觀性等優點[5]。

3BERT模型

DevlinJ等于2018年時提出了BERT模型,并指出模型是一種NLP領域的與訓練模型。BERT模型的核心內容是找出目標文本中每一個詞匯與其他任意詞匯的關系,在這基礎上,將詞匯與句子中或文本中其他詞匯的聯系充分表示出來,即BERT模型能更清楚地展現出詞匯在上下文的不同語義。其中,E1,E2,…EN表示需要進行訓練的目標文本中的文字的輸入,在經過編碼層的雙向的Transformer編碼器后,輸出的就是目標文本的向量化表示結果,即T1,T2,…TN分別對應輸入字的向量化表示結果。BERT語言訓練模型和其他模型相比,層數更深,對詞向量表示的結果更加泛化,能夠對目標文本中的任意詞匯或句子之間的關系進行更詳細地描述。但由于BERT模型在向量化時是經過編碼層的雙向Transformer編碼器所進行操作的,其輸出結果中的詞包含了該詞在其他句子中的所有語義,這對預測結果會產生影響。為解決此問題,BERT模型提出了兩個預訓練任務模型:Masked語言模型(MaskedLanguageModule,MLM)和下一個句子預測(NextSentencePrediction,NSP)模型。

4數據分析模型構建及分析

4.1BERT模型相關指標值計算

BERT分類算法的任務中,官方代碼文件中給出的評價指標只有準確率(Acc)與損失(Loss),為使實驗結果更準確,論文在官方代碼基礎上,新增了召回率(R)與精準率(P)的計算,然后加入到Return字典中,部分代碼如圖1所示,輸出指標值如圖2所示。從圖2可以清晰看出,準確率(Acc)值為0.8901413,精準率(P)值為0.91316281,召回率(R)值為0.89652703。通過計算,最終得到的F1的值約為0.904768456,即F1為90.48%。實驗結果表明,BERT模型分類方法能夠有效地處理詞匯本身在文本中不同位置的語義,且對中文文本的分類效果比較顯著,對情感極性的預測準確。

4.2基于ROSTCM6軟件的情感傾向分析

本文采用了由武漢大學教授團隊開發的ROSTCM6軟件,對目標文本進行了情感傾向分析,分析過程如圖3所示。

作者:張龍 吳旖婷 周遵爽 蔣合領 單位:中國電信股份有限公司貴州分公司產品創新(客戶研究)中心 哈爾濱商業大學計算機科學與技術 貴州財經大學信息學院