設(shè)備投資決策數(shù)據(jù)挖掘策略

時間:2022-05-29 11:07:00

導(dǎo)語:設(shè)備投資決策數(shù)據(jù)挖掘策略一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

設(shè)備投資決策數(shù)據(jù)挖掘策略

由于目前我國大多數(shù)貨運中心、貨運企業(yè)對企業(yè)設(shè)備的投資管理缺乏實用的全面綜合的決策評價體系和強有力的手段,因而使得企業(yè)對設(shè)備的投資決策僅僅停留在設(shè)備的技術(shù)性能和價格上,而完全沒有充分考慮設(shè)備壽命期內(nèi)的綜合性能。企業(yè)對設(shè)備的投資管理關(guān)系到設(shè)備在壽命期內(nèi)的實際利用效率和產(chǎn)生的經(jīng)濟效益,是設(shè)備管理的基礎(chǔ),投資管理的質(zhì)量和決策水平也就關(guān)系到了整個企業(yè)的經(jīng)濟效益。而企業(yè)在進行投資管理決策時所使用的數(shù)據(jù)也很少具備直接實用性,因此,引進其他行業(yè)相對較成熟的方法對本企業(yè)現(xiàn)有條件、數(shù)據(jù)進行處理、挖掘就顯得尤為重要。

1數(shù)據(jù)挖掘

CRM(CustomerRelationshipManagement,客戶關(guān)系管理)數(shù)據(jù)挖掘為各投資行業(yè)的中長期發(fā)展提供戰(zhàn)略性、決策性的技術(shù)支持;為企業(yè)的客戶(設(shè)備)管理、降低成本、增加收入、業(yè)務(wù)發(fā)展、增強國際國內(nèi)的競爭力等各方面都起到舉足輕重的作用。CRM是由美國的計算機技術(shù)咨詢和評估集團GartnerGroup提出的。從管理功能上來說,主要是通過采用信息技術(shù)等手段,使企業(yè)在市場營銷、客戶服務(wù)與支持等經(jīng)營流程信息化,實現(xiàn)客戶資源有效利用的管理思想。其核心是以“客戶為中心”。目前,CRM系統(tǒng)已普遍運用于銀行、保險、證券等各類投資行業(yè)中。擁有大量的客戶數(shù)據(jù),如何有效地利用這些數(shù)據(jù),分析出對于行業(yè)有用的知識,進而采取有效的市場行為來實現(xiàn)利潤的最大化,則是每個投資行業(yè)所面臨的問題。在大型物流運輸企業(yè)同樣面臨這樣的問題。數(shù)據(jù)挖掘(DataMining)數(shù)據(jù)挖掘是一類深層次的數(shù)據(jù)分析方法。就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用的信息和知識的過程。對現(xiàn)代企業(yè)來說,數(shù)據(jù)挖掘是一種新的現(xiàn)代信息處理技術(shù),通過對企業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行簡化、分類、抽取、轉(zhuǎn)換等技術(shù)分析處理,從中提取輔助商業(yè)企業(yè)決策的關(guān)鍵性數(shù)據(jù)。也可定義為為:按企業(yè)既定的業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進行探索和分析,揭示隱藏的、未知的或驗證的規(guī)律性,并進一步將其模型化的先進有效的方法。

2數(shù)據(jù)挖掘的步驟

Step1:數(shù)據(jù)準(zhǔn)備階段。具體包括:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換。數(shù)據(jù)選取:是根據(jù)企業(yè)用戶的挖掘目的從數(shù)據(jù)源中提取與挖掘相關(guān)的數(shù)據(jù)。數(shù)據(jù)預(yù)處理:是對選取出的數(shù)據(jù)進行初加工,主要包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對其中噪音數(shù)據(jù)進行處理,消除重復(fù)的記錄,從而達到初步簡化數(shù)據(jù)庫。數(shù)據(jù)變換:通過投影或數(shù)據(jù)庫的其它操作來降低數(shù)據(jù)的維數(shù),從而減少數(shù)據(jù)挖掘時數(shù)據(jù)的數(shù)量。提高挖掘算法效率。Step2:數(shù)據(jù)挖掘數(shù)據(jù)挖掘階段首先確定挖掘的任務(wù)和目的,其次是根據(jù)數(shù)據(jù)集的特征,選定合適的數(shù)據(jù)挖掘算法進行數(shù)據(jù)挖掘。數(shù)據(jù)挖掘算法是整個數(shù)據(jù)挖掘系統(tǒng)的核心部分,也是數(shù)據(jù)挖掘效果和質(zhì)量的保證。Step3:挖掘結(jié)果的表述和評價結(jié)果表述:數(shù)據(jù)挖掘的結(jié)果要用企業(yè)用戶能夠理解和接受的方式呈現(xiàn)給企業(yè)用戶。結(jié)果評價:對數(shù)據(jù)挖掘所獲得的結(jié)果和模型進行解釋,對決策支持信息的適用性做出評價,從而對樣本數(shù)據(jù)和模型進行檢驗,確定是否有必要重新進行挖掘,直到用戶滿意為止。

3數(shù)據(jù)挖掘的方法

數(shù)據(jù)挖掘技術(shù)的方法主要有:聚類分析、決策樹、神經(jīng)網(wǎng)絡(luò)、粗糙集數(shù)據(jù)挖掘等方法。聚類分析(clusteringanalysis)數(shù)據(jù)挖掘方法聚類是將所研究的數(shù)據(jù)劃分為若干組或類,在同一個類中的數(shù)據(jù)之間具有較高的相似度,而不同的類中的對象差別較大。在進行聚類分析時,不僅要考慮對象之間的距離,同時還要考慮劃分結(jié)果的現(xiàn)實意義。聚類分析主要集中在基于距離的聚類分析,可細(xì)分為劃分方法、層次方法、網(wǎng)格方法和密度方法等。決策樹(Decisiontree)數(shù)據(jù)挖掘方法決策樹方法是用來表示決策規(guī)則的樹的結(jié)構(gòu),是一種由內(nèi)部結(jié)點、分叉及葉結(jié)點構(gòu)成的。其中,內(nèi)部結(jié)點表示某種檢驗屬性,分叉表示檢驗的結(jié)果,葉結(jié)點表示類或某一類的分類,而頂點稱為根結(jié)點。通過構(gòu)造決策樹來發(fā)現(xiàn)訓(xùn)練集中分類知識的數(shù)據(jù)挖掘方法。決策樹的算法包括樹的構(gòu)造和剪枝。通常可分為回歸決策樹和分類決策樹。

神經(jīng)網(wǎng)絡(luò)方法(NeuralNetwork,NN)數(shù)據(jù)挖掘方法神經(jīng)網(wǎng)絡(luò)即人工神經(jīng)網(wǎng)絡(luò)是一種復(fù)雜的分類和回歸方法,1943年,美國心理學(xué)家W.S.Mcculloh與數(shù)學(xué)家W.H.Pirst合作,用邏輯數(shù)學(xué)工具研究客觀事件在形成神經(jīng)網(wǎng)絡(luò)中的數(shù)學(xué)模型表達,從此開創(chuàng)了對神經(jīng)網(wǎng)絡(luò)的理論研究。神經(jīng)網(wǎng)絡(luò)主要是由大量的、簡單的處理單元廣泛地互相連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),它反映人腦功能的許多基本特性,是一個高度復(fù)雜的非線性動力系統(tǒng)。它適應(yīng)處理需要同時考慮許多因素和條件的、精確和模糊的信息處理問題。粗糙集(RoughsetRS)數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法粗糙集理論是波蘭數(shù)學(xué)家Z.Pawlak在1982年提出的一種分析數(shù)據(jù)、處理模糊和不確定性問題的新型數(shù)學(xué)工具。其主要思想是在保持分類能力不變的前提下,通過知識約簡,刪除其中冗余或不重要的知識信息,導(dǎo)出問題的決策或分類規(guī)則,達到提高對有效數(shù)據(jù)的處理分析的速度和準(zhǔn)確度。在數(shù)據(jù)挖掘中,主要利用粗糙集來實現(xiàn)數(shù)據(jù)的分類、簡化、規(guī)則提取。利用粗糙集理論來進行數(shù)據(jù)挖掘有著較傳統(tǒng)數(shù)據(jù)挖掘工具所不具有的優(yōu)點。粗糙集理論處理數(shù)據(jù)不需要對數(shù)據(jù)的了解,也就是說不需要數(shù)據(jù)的先驗信息,比如統(tǒng)計學(xué)中的概率分布、模糊集理論中的隸屬度或概率值等。粗集的這一優(yōu)點對于現(xiàn)資行業(yè),這種處理數(shù)據(jù)的客觀性非常重要,因為隨著信息技術(shù)的飛速發(fā)展、經(jīng)濟的快速增長、國內(nèi)國際競爭日趨激烈,客戶的不確定性、模糊性特點顯著增強,無法找到有價值或價值長久的先驗信息。粗集數(shù)據(jù)挖掘技術(shù)可以幫助企業(yè)管理客戶(設(shè)備)生命周期的各個階段。利用粗糙集理論不僅可以從大量的客戶(設(shè)備)數(shù)據(jù)中,挖掘出潛在的,有價值的知識,對海量數(shù)據(jù)進化簡化;而且還可以挖掘數(shù)據(jù)間的內(nèi)在規(guī)律,得到數(shù)據(jù)的最簡規(guī)則表達,幫助企業(yè)業(yè)確定客戶(設(shè)備)的特點,進而能為客戶(設(shè)備)提供針對性的服務(wù)。

粗糙集理論具有以下幾個鮮明特點:具有很強的客觀性:用粗集處理不確定信息不需要提供任何先驗知識,具有很強的客觀性,從信息庫本身就可以挖掘數(shù)據(jù)之間的聯(lián)系,如權(quán)重系數(shù),粗糙隸屬函數(shù)等,而其他處理不確定信息的理論工具如模糊集和概率統(tǒng)計方法等都需要提供一些數(shù)據(jù)以外的附加信息或先驗知識,具有一定的主觀性。具有很強的數(shù)據(jù)挖掘處理能力:粗集能表達和處理不完備信息;通過知識約簡,在能保留關(guān)鍵信息的前提下對海量數(shù)據(jù)進行挖掘得到知識的最小表達;能識別評估數(shù)據(jù)之間的依賴關(guān)系、權(quán)重系數(shù);能得到易于證實的決策規(guī)則。