挖掘技術論文范文

時間:2023-04-11 07:33:46

導語:如何才能寫好一篇挖掘技術論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

挖掘技術論文

篇1

[關鍵詞]數據挖掘數據挖掘方法

隨著信息技術迅速發展,數據庫的規模不斷擴大,產生了大量的數據。但大量的數據往往無法辨別隱藏在其中的能對決策提供支持的信息,而傳統的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數據分析技術處理大量數據,并從中抽取有價值的潛在知識,數據挖掘(DataMining)技術由此應運而生。

一、數據挖掘的定義

數據挖掘是指從數據集合中自動抽取隱藏在數據中的那些有用信息的非平凡過程,這些信息的表現形式為:規則、概念、規律及模式等。它可幫助決策者分析歷史數據及當前數據,并從中發現隱藏的關系和模式,進而預測未來可能發生的行為。數據挖掘的過程也叫知識發現的過程。

二、數據挖掘的方法

1.統計方法。傳統的統計學為數據挖掘提供了許多判別和回歸分析方法,常用的有貝葉斯推理、回歸分析、方差分析等技術。貝葉斯推理是在知道新的信息后修正數據集概率分布的基本工具,處理數據挖掘中的分類問題,回歸分析用來找到一個輸入變量和輸出變量關系的最佳模型,在回歸分析中有用來描述一個變量的變化趨勢和別的變量值的關系的線性回歸,還有用來為某些事件發生的概率建模為預測變量集的對數回歸、統計方法中的方差分析一般用于分析估計回歸直線的性能和自變量對最終回歸的影響,是許多挖掘應用中有力的工具之一。

2.關聯規則。關聯規則是一種簡單,實用的分析規則,它描述了一個事物中某些屬性同時出現的規律和模式,是數據挖掘中最成熟的主要技術之一。關聯規則在數據挖掘領域應用很廣泛適合于在大型數據集中發現數據之間的有意義關系,原因之一是它不受只選擇一個因變量的限制。大多數關聯規則挖掘算法能夠無遺漏發現隱藏在所挖掘數據中的所有關聯關系,但是,并不是所有通過關聯得到的屬性之間的關系都有實際應用價值,要對這些規則要進行有效的評價,篩選有意義的關聯規則。

3.聚類分析。聚類分析是根據所選樣本間關聯的標準將其劃分成幾個組,同組內的樣本具有較高的相似度,不同組的則相異,常用的技術有分裂算法,凝聚算法,劃分聚類和增量聚類。聚類方法適合于探討樣本間的內部關系,從而對樣本結構做出合理的評價,此外,聚類分析還用于對孤立點的檢測。并非由聚類分析算法得到的類對決策都有效,在運用某一個算法之前,一般要先對數據的聚類趨勢進行檢驗。

4.決策樹方法。決策樹學習是一種通過逼近離散值目標函數的方法,通過把實例從根結點排列到某個葉子結點來分類實例,葉子結點即為實例所屬的分類。樹上的每個結點說明了對實例的某個屬性的測試,該結點的每一個后繼分支對應于該屬性的一個可能值,分類實例的方法是從這棵樹的根結點開始,測試這個結點指定的屬性,然后按照給定實例的該屬性值對應的樹枝向下移動。決策樹方法是要應用于數據挖掘的分類方面。

5.神經網絡。神經網絡建立在自學習的數學模型基礎之上,能夠對大量復雜的數據進行分析,并可以完成對人腦或其他計算機來說極為復雜的模式抽取及趨勢分析,神經網絡既可以表現為有指導的學習也可以是無指導聚類,無論哪種,輸入到神經網絡中的值都是數值型的。人工神經元網絡模擬人腦神經元結構,建立三大類多種神經元網絡,具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學習、自組織和自適應能力的種種優點。

6.遺傳算法。遺傳算法是一種受生物進化啟發的學習方法,通過變異和重組當前己知的最好假設來生成后續的假設。每一步,通過使用目前適應性最高的假設的后代替代群體的某個部分,來更新當前群體的一組假設,來實現各個個體的適應性的提高。遺傳算法由三個基本過程組成:繁殖(選擇)是從一個舊種群(父代)選出生命力強的個體,產生新種群(后代)的過程;交叉〔重組)選擇兩個不同個體〔染色體)的部分(基因)進行交換,形成新個體的過程;變異(突變)是對某些個體的某些基因進行變異的過程。在數據挖掘中,可以被用作評估其他算法的適合度。

7.粗糙集。粗糙集能夠在缺少關于數據先驗知識的情況下,只以考察數據的分類能力為基礎,解決模糊或不確定數據的分析和處理問題。粗糙集用于從數據庫中發現分類規則的基本思想是將數據庫中的屬性分為條件屬性和結論屬性,對數據庫中的元組根據各個屬性不同的屬性值分成相應的子集,然后對條件屬性劃分的子集與結論屬性劃分的子集之間上下近似關系生成判定規則。所有相似對象的集合稱為初等集合,形成知識的基本成分。任何初等集合的并集稱為精確集,否則,一個集合就是粗糙的(不精確的)。每個粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補集元素的元素。粗糙集理論可以應用于數據挖掘中的分類、發現不準確數據或噪聲數據內在的結構聯系。

8.支持向量機。支持向量機(SVM)是在統計學習理論的基礎上發展出來的一種新的機器學習方法。它基于結構風險最小化原則上的,盡量提高學習機的泛化能力,具有良好的推廣性能和較好的分類精確性,能有效的解決過學習問題,現已成為訓練多層感知器、RBF神經網絡和多項式神經元網絡的替代性方法。另外,支持向量機算法是一個凸優化問題,局部最優解一定是全局最優解,這些特點都是包括神經元網絡在內的其他算法所不能及的。支持向量機可以應用于數據挖掘的分類、回歸、對未知事物的探索等方面。

事實上,任何一種挖掘工具往往是根據具體問題來選擇合適挖掘方法,很難說哪種方法好,那種方法劣,而是視具體問題而定。

三、結束語

目前,數據挖掘技術雖然得到了一定程度的應用,并取得了顯著成效,但仍存在著許多尚未解決的問題。隨著人們對數據挖掘技術的深人研究,數據挖掘技術必將在更加廣泛的領域得到應用,并取得更加顯著的效果。

篇2

關鍵詞:數據挖掘電子商務應用

當今,國內外電子商務類網站日益興起。許多電子商務類網站都提供了一定程度的個性化服務,比如提供商品推薦服務。而構成這些個性化服務的基礎就是數據挖掘技術。

一、數據挖掘分析

1.數據挖掘的定義。數據挖掘(datamining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。包括存儲和處理數據,選擇處理大數據集的算法、解釋結果、使結果可視化。

2.數據挖掘的方法。從商業的角度來看,數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據。數據挖掘的方法大致可以分成4類:關聯分析、概括分析、分類分析、聚類分析。(1)關聯分析:分析表面上不相關數據之間的內在聯系,揭示各事之間的依賴性和相關性,分析范圍包括簡單關聯、因果關聯等。在電子商務中,用數據挖掘找到隱藏的關聯規則,當客戶瀏覽、搜索關聯規則中的某種商品時,就可以在頁面中以推薦商品的形式顯示關聯規則中的其它商品。在進貨計劃和促銷計劃中,也可以將這個因素考慮進去。(2)概括分析:即提取數據庫中指定的數據集合的一般特性,找出遍性規律。(3)分類分析:設置分類規則,把各個事務或實體按照性質和特征不同進行歸類,把數據層次化和規整化,從而建立數據的分類模型。(4)聚類分析:通過分析和歸納實體之間的特征差異,選出具相識特征的實體聚合成為一個類,并用某種規則來描述該類的相同屬性,形成一種聚類規則,實際上,它是與分類分析法互逆的過程。

3.數據挖掘的過程。該過程從大型數據庫中挖掘先前未知的、有效的、可實用的信息,并使用這些信息做出決策或豐富知識。(1)確定業務對象:清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。(2)數據準備。數據的選擇:搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據。(3)數據挖掘:對所得到的經過轉換的數據進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。(4)結果分析:解釋并評估結果。其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術。(5)知識的同化:將分析所得到的知識集成到業務信息系統的組織結構中去。

二、數據挖掘與電子商務的關系

在電子商務企業中,數據挖掘運用于客戶行為分析,企業從中受益體現在以下四個方面:(1)可以發現客戶和訪問者的愛好、生活模式。(2)可以爭取新顧客,怎樣使產品適銷對路、怎樣給產品定價、怎樣吸引單個客戶、怎樣優化Web網站。(3)可以用相應的信息確定顧客的消費周期,針對不同的產品制定相應的營銷策略。(4)可以確定客戶細分,為每一個客戶的獨特需求設計“量身定制”的產品。三、數據挖掘技術在電子商務中的應用

1.面向電子商務的數據挖掘系統設計。本系統電子商務平臺采用基于三層體系結構構建,服務器端采用先進的J2EE平臺構架,有完整的體系框架組成,具有很好的可擴展性、互聯性和可維護性。因此面向電子商務的數據挖掘系統由數據庫服務器、應用服務器和客戶端三層組成,整個體系結構是以J2EE企業級的構建技術為基礎。對數據挖掘過程中產生的數據,采用獨立的數據挖掘庫表存放,這樣既不影響也不依賴數據挖掘的數據源。應用服務器完成所有的數據挖掘運算,通過接受客戶端的設置,完成所有對數據進行探索、轉換、挖掘的工作。數據挖掘系統的每個功能模塊都以EJB的形式進行封裝,以實現分布式計算和負載平衡等分布式計算的要求,把具有繁重計算任務的模塊和用戶交互模塊分開。客戶端要負責數據挖掘流程的創建工作、所有功能模塊參數的設定以及各種可視化結果的顯示。用戶可以根據自己的要求任意創建各種形式的挖掘流程,同時按照需要執行某部分流程,獲取相應的可視化分析結果,其系統體系結構如圖所示。

面向電子商務的數據挖掘系統體系結構圖

2.面向電子商務的數據挖掘系統功能設計。面向電子商務的數據挖掘系統主要以下幾大功能模塊:(1)用戶信息分析。運用分類和聚類挖掘方法對用戶的信息分析,可以得到用戶的些特征。對用戶分類相當于對具有某些公共屬性的用戶群體建立了概要特征描述,這些特征可以用來對新增的用戶進行分類,可以發現未來的潛在用戶并開展有針對性的商務活動,如自動給一類特定的用戶發送銷售郵件,當屬于同一類的用戶再次訪問站點時為其動態地改變站點的內容等。通過這些舉措使商務活動能夠在一定程度上滿足用戶的要求,實現目標營銷。(2)商品信息分析。運用關聯規則挖掘發現商品訪問中所有關聯和相聯系的規則,可以從交易事務數據庫中發現商品間的相互聯系。這對電子商務公司組織站點網頁結構、開展有效的營銷策略非常有幫助。(3)物流信息分析。采用神經網絡預測技術,根據各物流配送點接到的網站用戶訂單來預測其庫存數量。預測信息可以給物流配送中心以參考,用來合理地確定各配送點倉庫的庫存量,使各配送點的補貨能更加合理有序,降低物流成本,節約庫存費用。

四、結束語

數據挖掘是一個新興的領域,具有廣闊應用前景,目前,電子商務在我國正處于快速發展和應用階段,利用數據挖掘技術,能夠強化對客戶的服務、促進市場最優化、加速資金周轉、實現企業的創新發展。電子商務平臺上的數據挖掘技術有待人們去進行更深入的研究工作,這將不斷的推動數據挖掘技術的深入發展和廣泛應用,創造出更多的社會和經濟價值。

參考文獻:

[1]張云濤龔鈴:數據挖掘原理與技術.北京,電子工業出版社,2004年1月

[2]方真等:電子商務教程[M].北京:清華大學出版社.2004

篇3

國外很多大學都開設了數據挖掘類課程,波士頓大學的“數據管理與商務智能”課程主要包括基礎、核心技術、應用三部分。授課方式包括理論內容講授、案例教學,以及學生以團隊合作方式完成項目并進行課堂演講。從麻省理工學院開放性課程資料(斯隆管理學院)中可以看出,在每章講解一種算法之后都盡可能地安排了商務實例的分析,并在課程后期安排了客座講座的形式。國內對于數據挖掘的教學類研究成果也很多,主要集中在三類問題的研究上,較為普遍的是根據專業建立大綱的研究,例如針對電子商務專業進行大綱設計;另外也有專注研究某一種或多種適合數據挖掘或商務智能的教學方法,如專題研討法;還有的討論算法理解與程序設計、軟件應用的關系。

2、基于模塊化方法的課程內容分析

模塊化教學模式是按照程序模塊化的構想和原則來設計教學內容的一整套教學體系,它是在既定的培養目標指導下,將全部教學內容按照一定標準或規則進行分解,使其成為多個相對獨立的教學模塊,且各教學模塊之間可以按照一定的規則有選擇性的重新組合。該方法在20世紀70年代,由國際勞工組織引入教學之中,開發出以現場教學為主,以技能培訓為核心的模塊化教學模式,在很多國家得到廣泛應用。由于該教學法具有針對性、靈活性、現實性等特點,越來越受到教育界的關注。模塊化教學本質上是以知識點與實踐的細化為出發點研究,本課程的知識點細化分為兩個層次:一是從宏觀角度,參考ACM的SIGKDD的數據挖掘課程建設建議,設計課程的基礎內容模塊和高級主題模塊;二是從微觀角度,針對較為復雜的算法進行的知識點劃分。課程內容的一至五章屬于基礎內容模塊,介紹本課程的基礎理論和入門的數據挖掘技術;六至第八章介于基礎內容與高級主題之間,介紹數據挖掘的核心算法,可以根據學生情況進行靈活處理,可強調應用,也可深化算法介紹;第九、十章為高級主題模塊,可以作為擴展材料介紹應用,或為感興趣同學提供算法介紹;課程實踐模塊包含數據倉庫建設與數據挖掘算法的應用,難度居中,可以在引導學生思考的前提下給出實驗步驟,并引導學生使用類似的方法處理不同的數據。

3、基于模塊化方法進行重要知識點的模塊化分析

重要知識點內涵較為豐富,一般體現在經典數據挖掘算法上,通常一大類算法下還分有多個算法,不同算法的在難度上有漸進層次,同一種算法也有很大改進研究空間,講授彈性比較大。因此,適合使用模塊化方法進行處理,并且需要在課程設計中明確一定課時量所要達到的內容和難度。基礎部分為必選內容,介紹基本概念和基本原理;決策樹作為數據挖掘分類算法的最基礎算法也是必選內容,決策樹算法有多種分類,需要進行按照難易程度進行選擇;最后要根據難度選擇其他分類算法進行介紹。

4、結論

篇4

檔案管理對象的數量隨著社會的發展而不斷增加,僅僅通過傳統的管理方式已不能高效管理檔案,這就需要充分利用計算機網絡技術。在檔案管理系統中應用計算機數據挖掘技術可以確保檔案信息的安全性,提高管理檔案的效率,還能優化檔案數據的檢索??傊?,基于大數據的計算機數據挖掘技術對完善檔案管理系統發揮著十分重要的作用。

2基于大數據的計算機數據挖掘技術概述

基于大數據的計算機數據挖掘技術是當代新開發的一種數據處理技術,它可以從大數據中挑選出人們需要的數據。計算機數據挖掘是一個循環往復的過程,如果沒有取得預期的效果,計算機數據挖掘信息處理系統就會返回上一層重新工作,直到完成目標任務為止,這種對目標的細化過程可以滿足檔案數據檢索的需要。

3基于大數據的計算機挖掘技術在檔案管理系統中的作用

3.1提高檔案信息的安全性。無論是文字檔案、圖片檔案還是其他形式的檔案,都是一種寶貴的資料。越是意義重大的檔案,檔案管理人員就越要想方設法將其保存起來。檔案的價值隨著其保存時間的不斷推移而增加,價值越高的檔案,被使用的頻率就越高,但是如果使用過于頻繁的話,就會縮短檔案資料的壽命,加大保存難度。除此之外,有的檔案信息是保密的,在應用時如果監管不力就會導致機密泄露。由以上可見,檔案的保存與使用儼然已互為對立面了。將計算機挖掘技術應用到檔案管理中則對檔案資料的完整性毫無影響,并且還可以提高檔案信息的安全性。3.2提高檔案信息管理的效率。在檔案管理工作中應用計算機數據挖掘技術,可以極大改變傳統檔案管理模式低效率的弊端。使用計算機數據挖掘技術,大大提高了工作人員處理檔案信息的速度,同樣的工作使用的時間極大減少。鑒定檔案是檔案管理工作中的重要組成部分,傳統的鑒定方式是由管理人員根據自己的經驗進行主觀鑒定,有時會存在有價值的檔案丟失的現象。應用計算機數據挖掘技術,檔案管理人員就可以利用計算機系統分析檔案使用和保存的情況,促進了檔案鑒定工作的發展。3.3提高了檔案信息的使用效率。大部分檔案信息具有一定的機密性,所以檔案的借閱并不是向全社會公開的,而是有范圍限制的,但是由于檔案管理人員和借閱者對檔案信息不熟悉,導致雙方的溝通存在一定的問題,在借閱者提出申請之后,檔案管理人員會將檔案資料調出來,有時調出來的資料不是借閱者所需要的,還得重新調閱,類似的過程就嚴重浪費了雙方的時間。應用計算機數據挖掘技術可以促進檔案管理人員和借閱者之間的交流,讓檔案管理者明確借閱者需要的具體檔案信息,從而形成專門的檔案提供渠道,這就大大提高了檔案信息的使用效率。3.4增強檔案信息的服務性。加密檔案信息會嚴重縮小它的適用范圍,受當代信息化的影響,很多檔案信息自身會出現一些問題,并且只能為一小部分人服務。將計算機數據挖掘技術應用到檔案信息管理中,可以具體分析檔案的使用情況,通過研究發現未來使用檔案信息的人群,在此基礎上提高檔案信息的服務性。

4基于大數據的計算機數據挖掘技術在檔案管理中的實際應用

4.1在檔案分類管理中的應用。檔案管理的基礎工作就是將檔案進行分類。傳統的分類方法既費時又費力,工作效率極低。計算機數據挖掘技術中有一種決策樹算法,它可以在最短的時間內按照一定的規則將不同屬性的檔案信息進行分類和整理,大大提高了檔案分類工作的效率。計算機數據挖掘技術在檔案分類工作中的具體流程是:從大量不同種類的數據集中選擇一些數據組合成訓練集,然后應用到沒有進行分類的檔案管理中,這樣可以幫助管理者根據借閱者對檔案信息的需求來對檔案進行分類,同時還可以根據借閱者的需求為其推薦其他檔案信息。通過這些針對性強的數據分析,可以極大縮短借閱者獲取檔案信息的時間,檔案數據的利用價值就能充分發揮出來。4.2在檔案收集管理中的應用。計算機數據挖掘技術可以根據數據庫內部的數據信息描述來構建一個相應的數據模型,然后比較計算機數據樣本和數據模型之間的差異,如果這二者互相吻合,就需要檔案管理人員使用測試樣本模型來對檔案信息進行分類處理。計算機數據挖掘技術需要全面分析檔案數據信息庫中的數據,建立一個對已知數據有詳細描述的概念模型,并與測試樣本進行對比,如果一個模型測試通過,就證明這個模型可以應用在檔案收集管理中。

5結語

綜上所述,在科技技術不斷進步的時代背景下,在檔案信息管理中應用基于大數據的計算機數據挖掘技術已成為一種必然趨勢,它可以極大提高檔案信息管理的工作效率,促進檔案管理的高效發展。除了在檔案信息存儲和利用上確?;镜男畔⒉樵兎胀猓€需要應用計算機數據挖掘技術整合檔案信息,建立眾多檔案管理服務數據之間的關聯,這樣才能為檔案信息管理提供更好的服務。

作者:陳皓穎 單位:昆明理工大學津橋學院

參考文獻

[1]高燕飛,陳俊杰.試析計算機數據挖掘技術在檔案信息管理系統中的運用[J].內蒙古師范大學學報:哲學社會科學版,2012(4):44-46.

[2]曾雪峰.計算機數據挖掘技術開發及其在檔案信息管理中的運用研究[J].科技創新與應用,2016(9):285.

[3]李國強,曹巧蓮,辛正宇,等.淺談數據處理的新技術———數據挖掘[J].科技創新與生產力,2010(6).

[4]周碧珍.淺析計算機數據挖掘技術在檔案信息管理系統中的應用[J].黑龍江科技信息,2009(1).

篇5

關鍵詞 情報學;碩士論文;關鍵詞

中圖分類號G251 文獻標識碼A 文章編號 1674-6708(2014)114-0013-02

當前,世界各國的許多高等院校和科學研究機構都在加強對圖書情報的研究,許多世界一流院校,比如Harvard University(哈佛大學)、Princeton University(普林斯頓大學)、Yale University(耶魯大學)、Massachusetts Inst. of Technology(麻省理工學院)等都建立了比較完善的情報學教育體系。而比較而言,在我國高等院校與科研院所對圖書情報學的相關研究,明顯要相對落后,近年來隨著改革開放的深入推進,有關情報學的招生和課題研究有所提升,并呈現出較為快速的增長態勢,然而由于研究內容相對較為高深,而且研究的靶場顯得較為前沿化與多元化?;陉P鍵詞對學位論文進行統計、研究與分析是文獻計量學的范疇,是圖書情報學研究的重要內容。即以學位文獻或學位文獻的某些特點為標的,以聚集梳理一定數量文獻為基礎,由此展開對某一時域某一領域科學技術基本狀況與基本特征的研究,并由此論述和預測該領域科學技術在今后一段時期的研究趨勢與特點規律態勢。基于獨特關鍵詞進行圖書情報領域的碩士學位論文進行分析,是情報學研究的一項重要方法,是一種將文獻資料中的眾多核心要素關聯起來,進行統計分析的引證分析方法,其可以較為科學地評價文獻所研究與發展的現狀和趨勢,揭示學科當時研究的熱點,較為準確地評價文獻所代表的學術水平。

1 研究對象數據來源

本文研究的對象定位于對國內圖書情報領域這一總體框架,并于此基礎上將“靶向”集中于碩士學位論文的統計、分析與研究,將“靶標”聚集到碩士學位論文的研究熱點、趨勢、重點、前沿以及其變化情況,從而更加清晰地梳理出我國情報學研究的發展脈絡,從而為我國情報學教育發展提供參考。研究的主要數據來源集中于國內著名的學位論文收集庫――中國知網CNKI學術文獻總庫、維普期刊資源整合服務平臺與萬方數據知識服務平臺“三大論文數據庫”,以及國內高等院校圖書館自建特色數據庫。其中,中國知網CNKI和萬方數據庫是國內收錄學位論文最為全面的數據庫,因此,為了確保分析研究的數據具有較高可信度與代表性,分析研究檢索的數據源即來自該兩個數據庫,著重定位于“學科專業名稱”、“學科專業分類”選項進行檢索,而檢索的時間區域定位于近10年,對于兩個數據庫檢索出來的文獻,對于相同的通過采用SQL 語句進行篩選,剔除重復的以及不符合的。

由此,以“情報學”作為檢索詞,從中國知網CNKI數據庫獲得1640篇碩士論文,從萬方數據庫中獲致1315篇碩士論文,通過SQL篩選剔除重復的以及不符合的795篇,總共獲得有效國內圖書情報領域碩士論文2160篇。

2 基于高頻關鍵詞的國內圖書情報領域碩士學位論文特點

通過對獲取到的2160篇國內圖書情報領域碩士論文進行研究,綜合統計論文的關鍵詞,累計關鍵詞有13976個,經過分析研究,去除不能表達論文主題概念的關鍵詞3645個,共得10331個,平均每篇碩士文獻關鍵詞數為4.78個,由此可說明該統計是科學的,與國外科文獻資料對關鍵詞的標引規則相符(國內外科技期刊要求的每篇關鍵詞應標出 3-8 個),接著對關鍵詞的詞頻進行統計分析,將關鍵詞的頻度大于60作為標準,將其定義為“高頻詞”,通過對“高頻詞”的統計分析,可以非常清晰地看出,有關“知識管理”這一主題的頻次最高,多達126次。無疑,這也證實了近些年來,學術界對知識管理這個方向的研究熱點。此外,“電子商務”為121次、“信息化”為118次、“信息技術”為112次、“競爭情報”為102次、“信息服務”為98次、“信息檢索”為96次、“數據挖掘”為87次、“數字圖書”為84次、“信息資源”為79次、“電子政務”為75次、 “知識服務”為71次、“知識共享”為68次、“數據倉庫”為63次,從中也反映了我國對信息化建設、知識服務、數字化建設等關注在日益提升,也驗證了我國國務院學位委員會重新頒布的《授予博士、碩士學位和培養研究生的學科、專業目錄》中“圖書館、情報與檔案管理”的實效,表明了情報學與管理學之間滲透和結合日益加強,也可以折射出當前研究的重點、熱點仍然集中在情報學基礎領域,并預示著今后情報學研究的一個重點將是對網絡信息資源的開發、整合與利用。

3 基于聚類共詞的國內圖書情報領域碩士學位論文特點

通常來說,僅僅通過孤獨地察看論文的某一關鍵詞,通常是難以有充足的理由說明該論文所研究的主題,然而通過關注兩個或者兩個以上的關鍵詞,將可以給予人們更加充分的信息去把握論文的大致內容和論文的主題脈絡。通過采取計算機數字高效處理作用,充分發揮Excel的數據透視功能,再次對出現次數高于60的高頻出現的關鍵詞進行“聚類性”分析,統計在同一論文中兩兩同時出現的關鍵詞,從而構建出60 × 60的“聚類共詞矩陣”,通過這一矩陣的研究,非常清晰地顯示出“聚類共詞矩陣”是一個對稱矩陣,其中位于矩陣對角線上的數據顯示的是某關鍵詞自身一同出現的頻次,這個一同出現的現象就實質來說,就是論文之間的相關度,對于非對角線上的數據,則表示不同關鍵詞之間的共現頻次。通過這個矩陣可以從另一個側反題出,關鍵詞分布既有交叉、相互滲透又具有群組分布的獨立性。通過Excel的數據透視處理得到共現頻次較高的有:“知識管理”為124次,“電子商務”為106次,“競爭情報”為101次,“高校圖書館”為98次,“信息服務”為92次,“數據挖掘”為87次,“數學圖書館”為83次,“信息資源”為81次,“電子政務”為79次,“知識共享”為72次,“數據倉庫”為66次。由此可以看出,在國內圖書情報領域碩士學位論文的研究主題中,當前基于數字化、信息化、電子化的知識管理與數據挖掘是個熱點,同時也說明我國情報學教育研究的領域在不斷拓寬。

綜合以上,關注獨特關鍵詞下國內圖書情報領域碩士學位論文研究的學科結構特點,獲得了基于高頻關鍵詞的國內圖書情報領域碩士學位論文特點,以及基于聚類共詞的國內圖書情報領域碩士學位論文特點,通過對研究結果的比較分析,得出了一些有較為充足理由支撐的結論,那就是從中可以較為清晰地得出,當前以及今后一段時期國內圖書情報領域碩士學位論文研究的側重點在于“數字化、信息化、電子化的知識管理與數據信息挖掘”。

參考文獻

[1]曾學喜.網絡輿情突發事件預警指標體系構建[J].情報理論與實踐,2013(11).

[2]Miao Adam X,Zacharias Greg L.A computational situation assessment model for nuclear power plant operations[J].IEEE Transactions on systems,Man and Cybernetics,2011(9).

篇6

醫學論文是醫學科研工作的最后階段,通過文字形式記錄醫學研究的最新結果。因此,撰寫醫學論文要把握醫學論文的基本要求、選題方法及一般體裁,從而達到主題和形式的和諧統一。

1 醫學論文的基本要求

1.1 創新性醫學論文的創新性是指文章要有新意,要發展醫學成就,破解醫學問題。醫學論文有無創新,選題是關鍵。選題創新是醫學論文寫作的靈魂,是衡量醫學論文價值的重要標準??审w現在:①理論方面的選題應有創新見解,既要反映作者在某些理論方面的獨創見解,又要提出這些見解的依據;②應用方面的選題應有創新技術等,也就是要寫出新發明、新技術、新產品、新設備的關鍵,或揭示原有技術移植到新的醫學領域中的效果;③創新性還包括研究方法方面的改進或突破。

1.2 可行性 所謂選題的可行性,是指能夠充分發揮作者的綜合條件和可以勝任及如期完成醫學論文寫作的把握程度。選題切忌好高鶩遠,脫離實際,但也不應過低,影響主客觀的正常發揮,降低了醫學論文的水平。影響選題的可行性因素有:①主觀條件,包括作者知識素質結構、研究能力、技術水平及特長和興趣等;②客觀條件,包括經費、資料、時間、設備等。

1.3 實用性 撰寫醫學論文的目的是為了交流及應用。要從實際出發,選擇夠指導科研、指導臨床、造福人類的主題,因此,選題的實用性尤為重要。

1.4 科學性 醫學論文是臨床和醫學科學研究工作的客觀反映,其寫作的具體內容應該是取材客觀真實、主題揭示本質、科研設計合理、論證科學嚴謹、表達邏輯性強、經過實踐檢驗。所以,嚴格遵守選題的科學性原則,是醫學論文寫作的生命

1.5 前瞻性 要選擇有研究價值及發展前途的主題,應積極開發研究新領域、新學科和新理論。2 選題的基本方法

2.1 根據課題研究的結論來確定主題 這是常用的方法,可分為:①以科研的結論或部分結論作為醫學論文的主題;②科研結果與開題時預測不一致,待查出原因后,再尋找主題;③科研達不到預期結果,可總結經驗,從反面挖掘主題。

2.2 在科研過程中選題 醫學科研的過程中,有時會出現意外的現象或問題,作者如果能夠細心觀察、及時發現,可以在這些偶然中獲得新的選題。

2.3 在臨床實踐中選題 臨床工作是醫學論文寫作取之不盡的源泉,作者在臨床中會經常遇到許多需要解決的實際應用問題或理論問題,對此,只要從本學科實際出發,用心思考,會從中產生很多好的主題。其包括:①探討發病機制與預后情況;②分析臨床癥狀與表現;③研究診斷方法和治療方法;④疾病的多因素分析等。

2.4 從文獻資料中選題 醫學文獻是人們長期積累的寶貴財富,是醫學論文選題的重要來源。閱讀最新文獻資料,可以了解當前醫學科學研究的進展情況,開拓思路、激發靈感,從而挖掘提煉出好的醫學論文主題。

3 醫學論文的一般體裁

3.1 實驗研究 一般為病因、病理、生理、生化、藥理、生物、寄生蟲和流行病學等實驗研究。主要包括:①對各種動物進行藥理、毒理實驗,外科手術實驗;②對某種疾病的病原或病因的體外實驗;③某些藥物的抗癌、抗菌、抗寄生蟲實驗;④消毒、殺蟲和滅菌的實驗。

3.2 臨床分析 對臨床上某種疾病病例(百例以上為佳)的病因、臨床表現、分型、治療方法

和療效觀察等進行分析、討論,總結經驗教訓,并提出新建議、新見解,以提高臨床療效。

3.3 療效觀察 指使用某種新藥、新療法治療某種疾病,對治療的方法、效果、劑量、療程及不良反應等進行觀察、研究,或設立對照組對新舊藥物或療法的療效進行比較,對比療效的高低、療法的優劣、不良反應的種類及程度,并對是否適于推廣應用提出評價意見。

3.4 病例報告 主要報告罕見病及疑難重癥;雖然曾有少數類似報道但尚有重復驗證或加深認識的必要。

3.5 病例(理)討論 臨床病例討論主要是對某些疑難、復雜、易于誤診誤治的病例,在診斷和治療方面進行集體討論,以求得正確的診斷和有效的治療。臨床病理討論則以對少見或疑難疾病的病理檢查、診斷及相關討論為主。

3.6 調查報告 在一定范圍的人群里,不施加人工處理因素,對某一疾病(傳染病、流行病、職業病、地方病等)的發病情況、發病因素、病理、防治方法及其效果進行流行病學調查研究,給予評價,并對防治方案等提出建議。

篇7

1.1創新性醫學論文的創新性是指文章要有新意,要發展醫學成就,破解醫學問題。醫學論文有無創新,選題是關鍵。選題創新是醫學論文寫作的靈魂,是衡量醫學論文價值的重要標準??审w現在:①理論方面的選題應有創新見解,既要反映作者在某些理論方面的獨創見解,又要提出這些見解的依據;②應用方面的選題應有創新技術等,也就是要寫出新發明、新技術、新產品、新設備的關鍵,或揭示原有技術移植到新的醫學領域中的效果;③創新性還包括研究方法方面的改進或突破。

1.2可行性所謂選題的可行性,是指能夠充分發揮作者的綜合條件和可以勝任及如期完成醫學論文寫作的把握程度。選題切忌好高鶩遠,脫離實際,但也不應過低,影響主客觀的正常發揮,降低了醫學論文的水平。影響選題的可行性因素有:①主觀條件,包括作者知識素質結構、研究能力、技術水平及特長和興趣等;②客觀條件,包括經費、資料、時間、設備等。

1.3實用性撰寫醫學論文的目的是為了交流及應用。要從實際出發,選擇夠指導科研、指導臨床、造福人類的主題,因此,選題的實用性尤為重要。

1.4科學性醫學論文是臨床和醫學科學研究工作的客觀反映,其寫作的具體內容應該是取材客觀真實、主題揭示本質、科研設計合理、論證科學嚴謹、表達邏輯性強、經過實踐檢驗。所以,嚴格遵守選題的科學性原則,是醫學論文寫作的生命。

1.5前瞻性要選擇有研究價值及發展前途的主題,應積極開發研究新領域、新學科和新理論。

2選題的基本方法

2.1根據課題研究的結論來確定主題這是常用的方法,可分為:①以科研的結論或部分結論作為醫學論文的主題;②科研結果與開題時預測不一致,待查出原因后,再尋找主題;③科研達不到預期結果,可總結經驗,從反面挖掘主題。

2.2在科研過程中選題醫學科研的過程中,有時會出現意外的現象或問題,作者如果能夠細心觀察、及時發現,可以在這些偶然中獲得新的選題。

2.3在臨床實踐中選題臨床工作是醫學論文寫作取之不盡的源泉,作者在臨床中會經常遇到許多需要解決的實際應用問題或理論問題,對此,只要從本學科實際出發,用心思考,會從中產生很多好的主題。其包括:①探討發病機制與預后情況;②分析臨床癥狀與表現;③研究診斷方法和治療方法;④疾病的多因素分析等。

2.4從文獻資料中選題醫學文獻是人們長期積累的寶貴財富,是醫學論文選題的重要來源。閱讀最新文獻資料,可以了解當前醫學科學研究的進展情況,開拓思路、激發靈感,從而挖掘提煉出好的醫學論文主題。

3醫學論文的一般體裁

3.1實驗研究一般為病因、病理、生理、生化、藥理、生物、寄生蟲和流行病學等實驗研究。主要包括:①對各種動物進行藥理、毒理實驗,外科手術實驗;②對某種疾病的病原或病因的體外實驗;③某些藥物的抗癌、抗菌、抗寄生蟲實驗;④消毒、殺蟲和滅菌的實驗。

3.2臨床分析對臨床上某種疾病病例(百例以上為佳)的病因、臨床表現、分型、治療方法和療效觀察等進行分析、討論,總結經驗教訓,并提出新建議、新見解,以提高臨床療效。

3.3療效觀察指使用某種新藥、新療法治療某種疾病,對治療的方法、效果、劑量、療程及不良反應等進行觀察、研究,或設立對照組對新舊藥物或療法的療效進行比較,對比療效的高低、療法的優劣、不良反應的種類及程度,并對是否適于推廣應用提出評價意見。

3.4病例報告主要報告罕見病及疑難重癥;雖然曾有少數類似報道但尚有重復驗證或加深認識的必要。

3.5病例(理)討論臨床病例討論主要是對某些疑難、復雜、易于誤診誤治的病例,在診斷和治療方面進行集體討論,以求得正確的診斷和有效的治療。臨床病理討論則以對少見或疑難疾病的病理檢查、診斷及相關討論為主。

3.6調查報告在一定范圍的人群里,不施加人工處理因素,對某一疾病(傳染病、流行病、職業病、地方病等)的發病情況、發病因素、病理、防治方法及其效果進行流行病學調查研究,給予評價,并對防治方案等提出建議。

篇8

關鍵詞:研究型;學習;培養;科研實踐

對于高校而言,研究生既是知識傳授的對象,又是日??蒲泄ぷ鞯膮⑴c者,其理論學習過程和科研能力的培養相互交融且呈現多變的特點。[1][2][3]

筆者目前暫不具備獨立招收研究生的資格,但依托研究團隊和所承擔的科研項目,每年都會協助指導若干名研究生(碩士生、博士生)順利畢業。在協助指導這些研究生學習和開展科研工作的過程中,積累了一些經驗。結合筆者2013~2014年前往英國訪問交流一年過程中參加教學培訓項目和科研合作項目的體會,本文從研究型學習方法及其在科研實踐中的應用等方面淺析研究生培養工作的體會。

一、基于研究型學習的培養特點剖析

1.基于研究心態的理論知識學習

為了便于開展科研理論分析工作, 研究生培養的初期階段需要有針對性地選擇專業課程知識學習,而專業課的授課內容更突出針對性和研究性。[4][5]研究生若帶著研究的心態學習這些專業課程,必將在學習過程中能更好地鍛煉對科學問題的認識、分析和解決的能力。

實現專業課程的研究型學習,對專業課的講授方式和內容設置也提出了一定的要求。筆者在英國哈德菲爾德大學留學期間,對于該校課程設置和講授方式深有感觸。在跟課的“Dynamic Analysis and Control”課程中,主講教師通過設置多個實際工程應用案例開展授課內容講解,實例中計算數據均來自實際工業系統,布置的作業也與科研項目緊密相關。這種研究型的授課和學習模式,可以使得研究生對所學內容的整體把握和應用有了更為直觀的認識,對于今后開展研究工作也有觸類旁通的優勢。

帶著研究的心態來學習理論知識, 還可以通過對應的科研實踐來鞏固研究生理論水平培養的效果。通過適當的科學研究實踐,將最新的科研成果和知識動態融于理論學習過程,可以在一定程度上彌補理論學習的抽象性、知識的落后性等不足,實現研究生綜合科研素質的扎實培養。[6]

2.基于主動挖掘的科研實踐思維

研究生的培養中,“學”與“研”的培養相互作用、互為促進?!皩W”是手段,“研”是目的。多學是為了更好地研究,深入的科研工作可以為主動學習提供積極的動力。

研究生通過理論知識學習,具備了一定的獨立開展理論知識學習、獨立從事科研活動的能力。將其引入科研項目中,根據個人特長和興趣愛好進行項目分工,可以充分調動研究生的參與積極性和探索熱情,使其能夠自主地、全身心地投入到科研實踐活動中。在此階段,研究生的科研實踐熱情被充分激發和釋放,將主動收集與所研究領域有關的資料和文獻,通過整理、消化和吸收,主動挖掘更為深入的理論知識背景,形成獨立的見解和科研成果。

主動挖掘的過程中,科研活動促進了理論知識的學習,理論知識的挖掘提升了科研能力水平,體現了研究生培養的“研”“學”并重特點,和以“研”促“學”的培養理念。

二、實踐研究型培養方法的一些舉措

1.科研實踐培養突出研究特點

(1)引導研究生承擔部分理論研究工作,培養從理論上解決技術難題,形成解決方案的能力。此外,研究生還要承擔一部分的工程任務,以鍛煉其實踐能力,明確研究活動的理論與實踐關系。

(2)構建包括研究生在內的研究團隊定期學術討論與總結機制,以競賽激發科研興趣,加強互聯網資源使用的引導??偨Y交流是提高研究水平的重要途徑,借助互聯網這一開放式學習平臺,研究生可與組內外、國內外學者分享最新的研究成果,實現互補與互助提高。

(3)開展全面而深入的學術訪問和交流。學術無止境,交流共提高。研究生在培養階段應該多走出校門,借助國內外學術會議平臺培養建立學術聯系、提升交流水平和展示學術成果能力,為以后潛在的合作研究奠定基礎。筆者在英訪學期間,曾走訪了帝國理工學院、曼徹斯特大學、巴斯大學等知名學府,他們的科研硬條件一流,軟實力水平也非常高。這些大學的研究非常開放,很歡迎中國的留學生前去參與科研項目研究。國內的研究生可以積極聯系這些單位,爭取去聯合培養的科學研究機會。

2.學術論文撰寫體現高度責任心

高水平學術論文的撰寫是檢驗研究生培養成效和研究能力的一個有效手段。通過撰寫高水平學術論文,一方面研究生可以梳理理論學習過程中存在的不足,另一方面也可以凝練研究工作,提升學術研究的理論水平。

(1)論文選題要明確、突出研究價值,內容要詳實、有據可依。所撰寫的內容應來源于自己的科學研究實踐中的所思所想,撰寫時需要精心設計論文內容和組織結構,重視文獻查閱與閱讀工作,對所研究內容和發展現狀等要有深刻的認識。

(2)論文撰寫要沉下去、靜下心, 敢于取舍。研究生在初學撰寫、修改論文時,必須要靜下心、鉆進去,腳踏實地一步一步鍛煉,不斷挖掘和提高理論深度。同時,要讓論文的內容充分地“沉淀”并經得起推敲,過濾掉“雜質”。筆者在訪學期間,與國外學者交流,他們通常的寫作過程是,首先用一到兩個月寫出論文初稿,然后將其放置一段時間后至自己忘記稿件內容,再次閱讀并修改稿件。這種方法被他們形象地稱為“遺忘式”寫作方法,筆者實踐過,確實行之有效。

3.行文注意豐富多變的科技詞匯運用

學術論文通過嚴謹、凝練的表述來展示研究人員的理論研究成果,研究生在行文時如果英語基礎較好、寫作功底扎實,則可以運用豐富而準確的科技詞匯來組織內容,達到錦上添花的效果。廣泛閱讀英文參考文獻是擴展詞匯量和提升英文行文水平的有效手段。

三、結論

研究生的培養是一個反復迭代的系統過程,帶著研究的心態去學習理論知識、將學習的過程融入科研實踐,從而提升研究生的理論水平和鍛煉科研能力,使其具備獨立開展科研工作的能力。通過這些有針對性的培養措施,可以顯著提高研究生培養質量,為其日后順利走上工作崗位奠定基礎。

參考文獻:

[1]黃文濤,趙學增.國外碩士研究生培養模式述評及啟示[J].研究生教育研究,2013(03).

[2]季俊杰.優秀研究生科研能力的影響因素與啟示[J].研究生教育研究,2013(02).

[3]向 誠,柴 毅,王東紅,等.緊貼行業需求,校企協同培養控制工程領域高層次應用型人才[J].學位與研究生教育,2014(04):11―15.

[4]汪 洋,高久群,汪華僑,等.香港中文大學研究生教育的特點及其啟示[J].學位與研究生教育,2014(06).

[5]郭雅麗,任永泰,鄧華玲.碩士研究生課程設置研究[J].研究生教育研究,2013(15):47―50.

篇9

關鍵詞:推薦系統;云計算;數據挖掘;個性化

中圖分類號:TP393 文獻標識碼:A DOI:10,3969/J.issn.1003-6970.2013.03.001

本文著錄格式:[1]郭平,劉波,沈岳,農業云大數據自組織推送關鍵技術綜述[J].軟件,2013,34(3):1-6

0 引言

隨著物聯網、云計算、下一代互聯網等新一代信息技術的快速發展和信息內容的日益增長,“信息過載”問題愈來愈嚴重,推薦系統(recommender systems)被認為可以有效的緩解此難題,幫助用戶從海量數據中發現感興趣信息,滿足個性化需求。

近年來,我國在農業個性化知識服務服務領域從本體論、語義網、知識工程角度開展了廣泛的研究,成果主要體現在三個方面:以搜索引擎為代表的知識檢索系統,需回答大量預設問題進行知識推理的專家系統,特定領域應用系統,它們在各自的場合都發揮了積極作用。然而知識檢索系統不能滿足用戶個性化需求,專家系統的應用很難普及,特定領域應用開發成本高和重用難度大。物聯網與數據挖掘云服務提供知識服務云實現物理世界的“感知控”,知識服務云的研究主要集中在制造和圖書情報領域,云環境下的農業個性化知識服務的研究尚處于起步階段,主要集中在服務模式的構建與展望。

本文是對科技部科技支撐課題“農村農業信息化關鍵技術集成與示范”(2011BAD21803)與“農村物聯網綜合信息服務科技工程”(2012BAD35800)研究成果的總結,也是對農業云推薦系統研究的升華。

1 農業云大數據自組織區域推送的提出

1.1 農業信息資源特點

我國自“十一五”時期以來,農業農村信息化發展取得了顯著成效,主要表現在農業農村信息化基礎設施不斷完善、業務應用深入發展、物聯網技術在農業中逐步推廣應用等方面。從中央到省,市、縣建立了“三農”綜合信息服務平臺,涉農企業、組織和科研院所也積極搭建了各具特色的農業信息服務平臺,目前正向鄉鎮村發展。農村信息員隊伍及以農業綜合信息服務站和農業合作社為代表的農村信息服務機構發展迅速,“三電合一”、“農民信箱”、“農村熱線”等信息服務模式應用深入。云計算利用海量的存儲能力把農業信息資源形成高度集成和虛擬化的計算資源一“農業知識聚合云”,支持用戶在任意位置、使用各種終端方便獲取信息,但由于農業領域生態區域性和過程復雜性及農業區域發展不平衡和農民文化的多層次性也帶來了“信息過載”、“資源隱晦”“資源迷向”等問題。

1.2 農業云環境下大數據自組織區域推送

物聯網和云計算背后是大數據,在云計算模式下,用戶不確定的、智能的交互,個性化需求更加多元化,信息交互行為更加頻繁;在大量用戶通過社會標注達成共識的過程中,逐漸形成不同社區,涌現出群體智能,形成“農業用戶興趣社交云”。利用云的海量存儲、群體涌現智能、強大的計算能力和物聯網感知控優勢,可以提供面向用戶復雜分析計算,實現業務重點由面向應用和資源的傳統信息服務,轉變為基于對海量農業知識進行動態劃分,有目的、主動、定制、自組織推送給有需求的農業用戶,為農業用戶提供實時性、個性化知識服務,指導農業生產過程。

首先以Hadoop+MapReduce+HBaSe分布式框架為處理平臺,對“農業用戶興趣社交云”,融合用戶興趣偏好和社交網絡進行建模,將這些多元用戶信息充分融入推送系統會更好產生推薦結果;將推薦對象“農業知識聚合云”按農業知識高維性、多樣性、多層次性特征分類聚類為各種知識塊靜態和動態元數據;通過智能算法推薦和社會網絡推薦為用戶發現個性化內容;根據用戶的地理位置、用戶服務的評價以及云基礎服務提供商信息將預測值最高的服務推送給用戶實現與物理世界的互動(如圖1)。

從以上分析可知,農業云大數據自組織區域推送的關鍵技術有用戶興趣模型、推薦對象模型,推薦算法、數據挖掘四個部分,以下分別對這幾項技術進行論述。

1.2.1 用戶興趣模型

用戶興趣建模是個性化服務技術的基礎和核心,包括數據收集、模型表示、模型學習與模型更新。用戶興趣建模的方法有很多,常用的有向量空間模型、神經網絡、遺傳算法、用戶一項目評價矩陣、基于案例的表示、基于本體論的表示、基于加權關鍵詞的表示,基于社會網絡的表示等。幾乎每種表示形式都是以一種私有形式進行知識表示,此外一些表示技術還依賴于模型學習,如廣泛使用的基于向量空間模型的表示與TF-IDF學習技術聯系在一起。表示形式的私有性和對學習技術的依賴性阻礙了用戶模型在系統間的共享,這種共享對于減少用戶建模工作量,提高推薦算法啟動效率具有重要意義。因此開發獨立于模型學習技術的通用用戶模型表示技術是目前研究中熱點,基于語義網和社交網絡的用戶模型在這方面表現了優勢。

用戶的興趣或需求會隨時間、情景發生變化,結合長期和短期興趣及興趣的變化用戶興趣建模的重點,目前的更新機制很難及時跟蹤用戶興趣的變化,有更好的學習效率和動態變化適應能力的建模是未來的重要研究方向,國內外大量的文獻對此展開了研究,遺忘函數、時間窗、用戶興趣的漂移特性等被提出。

在湖南農業云中,基于呼叫中心、互聯網,手機報、手機短信,電視廣播等用戶在多應用系統中形成的興趣偏好和社交網絡特征,提出“農業用戶興趣社交云”建模思路:以圖論模型表示用戶“興趣圖”數據和“社交圖”數據,根據經典的局域世界演化理論,綜合考慮實際情況中用戶之間的多重關系和關系的強弱程度,以用戶之間相似度為節點連接概率因素,生成動態多維網絡,進行用戶數據的挖掘和更新;結合農業本體,在多維社交網絡的基礎上,將基于農業本體的區域用戶興趣融合在云計算平臺上進行處理。

1.2.2 推薦對象模型

推薦本質上是將推薦對象的特征與用戶的興趣偏好進行推薦計算,所以推薦對象的描述和用戶的描述密切相關。推薦系統應用不同領域,它推薦的對象也就各不相同,目前,湖南農業云主要是文本性數據;不同的對象,特征也不相同,目前沒有一個統一的標準來進行統一描述,主要有基于內容、分類、聚類的方法。

基于內容的方法是從對象本身抽取信息表示對象,常見的是向量空間模型,使用最廣泛的是加權關鍵詞矢量方法進行特征選取,使用TFIDF計算每個特征的權值。向量空間模型對模型中的特征詞進行權重估計(TF-IDF)過程中不考慮特征詞之間的相關性,直接用特征詞作為維度構建文檔向量,降低了文檔向量對文檔概念表達的準確性以及對不同類型文檔的區分能力。

基于分類的方法是把推薦對象放入不同類別,把同類文檔推薦給對該類文檔感興趣的用戶。主要有兩種,一種是基于知識工程的方法,使專家的類別知識直接編碼為分類規則,正確率和召回率高,但工作量大;近期研究最多的是另一種一機器學習,根據訓練樣本集建立分類器,方法有很多,常見的有概率分類、貝葉斯回歸分析、決策樹分類器、決策規則分類器、Rocchio分類器、神經網絡分類器、支持向量機(SVM)、分類器融合、Boosting分類器、k最近鄰方法(KNN)等。

研究文本聚類的最初目的是為了提高信息檢索的查全率和查準率,近年來,文本聚類用于自動產生文本的多層次的類,并利用這些新生成的類對新文本進行效率較好的歸類,已經提出了大量的文本聚類算法。傳統的聚類算法在處理高維和海量文本時效率不很理想。針對這樣的問題,將聚類分析與計算智能理論,并行計算、云計算等相結合,設計出高效的并行聚類算法,己經成為一個比較流行的研究思路。

在湖南農業知識云數據模型中,將能更好反映特征詞相關性的超圖模型引入,將文檔中提取的特征項表示為圖中節點,特征詞條之間的關系構成圖中邊,用邊上權值表示相關聯特征項之間共現程度。通過對文本圖模型K最近鄰劃分實現降維降噪的粗粒度數據切片;對切片后數據反映用戶興趣如地域、時間、訴求等多維度特征的智能聚類,實現細粒度的聚合與分割。

“農業知識聚合云”模型算法建立在基于MapReduce處理的大規模圖上,得到各種知識塊靜態和動態元數據。

1.2.3 推薦算法

推薦算法是整個推薦系統中核心部分,大量的論文和著作都關注了這個方面。目前,基本包括以下幾種:基于內容過濾推薦、協同過濾推薦、基于關聯推薦、基于知識推薦、基于效用推薦、基于網絡結構推薦、基于聚類推薦、基于社會網絡分析推薦、混合型推薦等。通過對眾多推薦算法進行比較分析,各種算法都有優缺點(如表1):

各種推薦方法都有各自的優缺點,在實際問題中采用多種策略進行混合推薦,主要有兩種混合思路:推薦結果混合和推薦算法混合。目前大部分的推薦算法都是混合推薦算法,主要還是以協同理論為核心,再配合其他算法的優點或交叉學科的理論來改善推薦的質量。另外基于社會網絡個性化推薦算法研究是一個趨勢,基于社會網絡的推薦是協同過濾的延伸,通過考察結點之間(用戶和用戶之間或產品之間)的相關性和結點之間的信任度可以獲得比一般協同推薦更高推薦效果,如文獻提出將社會網絡關系結合到推薦算法中。縱觀國內外在推薦算法上的研究,主要集中在基于用戶顯性評分數據的協同過濾算法上,對基于非顯性評分行為數據場景下的研究卻顯得有點不足。目前在擴展性問題上學術研究不是很具有針對性,主要集中在通過各種交叉學科中的方法來對用戶進行聚類或對行為數據進行降維、壓縮等縮短推薦的項目集或減少計算量,從而提升算法的性能;有關基于云平臺上的推薦算法研究目前主要集中于協同過濾算法MapReduce化。而實際應用中,己出現利用分布式集群解決算法擴展性方法,如Google News的推薦算法就是部署在分布式環境下,從而滿足海量數據下的推薦服務。

根據農業云大數據自組織區域推送實際情況將推薦結果和推薦算法混合,提出“三層推薦”策略:在豐富的知識塊云元數據基礎上,將知識塊屬性和用戶興趣行為基于頻繁模式的知識關聯撮合推薦;通過復雜網絡聚類算法識別一個用戶多個社區興趣,融合“興趣圖”和“社交圖”協同過濾推薦,突破算法推薦的局限性,讓用戶信任的朋友圈子為其發現和推薦內容,取得社交推薦的時效性和算法推薦的長尾性之間的互補,從而針對每個社區成員提供精準個性化推薦;根據基礎設施服務供應商、用戶所在的地理位置以及用戶對服務可用性評價值的相似性等,將大量用戶云終端聚類為一定數量的社區,提高云端推送服務的有效性,最終形成通過大眾參與,支持云間變換,集電信網、廣播電視網、互聯網合一的自組織區域推送,較有效地處理一般推薦算法中存在的稀疏性、冷啟動以及大規模實時計算的問題。

1.2.4 云計算下個性化數據挖掘

數據挖掘采用了多種領域中的思想,包括來自統計學的抽樣、估計、假設檢驗以及人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。隨著數據挖掘的不斷發展,也采用了包括最優化、進化計算、信息論、信號處理、可視化、信息檢索、云計算、并行計算等技術。與傳統的數據挖掘相比,云計算下的個性化數據挖掘的目標,就是通過云計算中心,向用戶提供針對其即時演化需求的數據挖掘SaaS(Software as aService,軟件即服務)服務,其基礎問題主要為:對于用戶不同的數據挖掘需求以及針對用戶特點進行個性推薦的建模和表征;數據挖掘算法適應云計算的并行分布式化;使數據挖掘的結果和算法能夠支持云間變換并形成一種面向用戶、即時組合的、變粒度的云服務,其中數據挖掘的云服務化是研究的難點。

(1)云計算下個性推薦的建模和表征

云下的個性推薦建模和表征與傳統上個性化推薦明顯的不同在于海量異構大數據和用戶間群體涌現的社交網絡,它們本質上形成了多個頂點的大規模圖。云計算可以為大規模個性化提供技術支撐,云服務本身也有大規模個性化定制應用需求,目前研究兩者結合的文獻還很少,張澤華從計算資源的角度基于復雜系統理論對云計算聯盟體系結構進行建模,并基于蟻群優化算法和復雜系統理論進行了負載均衡研究;郭昱就有效處理客戶需求信息該如何選擇與分布云計算平臺中的關鍵節點問題,提出了基于云計算的大規模定制客戶需求模型。趙東杰對復雜網絡、數據挖掘與群體智能有效結合進行了探索研究。農業云大數據自組織推送通過“農業知識聚合云”分解的靜態、動態知識元數據和“農業用戶興趣社交云”形成的興趣圖、社交圖基于用戶行為和知識元數據的關聯撮合,通過人工智能和社交圈子幫助用戶發現內容,實現搜索和推薦的無縫結合,為智能個性化推薦實現“內容找人”愿景。

(2)算法并行分布式與高性能計算

對于大規模數據的處理,典型系統結構大致分為三類:基于MapReduce模型的分布式并行處理系統、基于BSP模型的分布式并行處理系統和分布式圖數據庫系統。數據挖掘算法現在的發展趨勢是基于云計算的并行數據挖掘,它的同一個算法可以分布在多個節點上,多個算法之間是并行的,多個資源實行按需分配,而且分布式計算模型采用云計算模式,數據用DFS或者HBASE,編程模式采用MapReduce這種方式。Bhaduri等整理了一個十分詳盡的并行數據挖掘算法文獻目錄,包含了關聯規則學習、分類、聚類、流數據挖掘四大類分布式數據挖掘算法,同時還包括分布式系統、隱私保護等相關的研究工作。

2 基于云計算推薦系統研究的重點、難點與熱點

2.1 云環境下用戶偏好獲取安全與可信問題

推薦系統中,用戶數據集的數量和質量問題,影響用戶模型的精確度、可用性,導致問題的根本原因在于用戶對隱私和安全的考慮。而云環境下,數據的安全與隱私是用戶非常關心的問題。既能得到準確用戶信息而提高推薦系統性能,又能有效保護用戶信息同時檢測并能預防推薦攻擊(一些不法的用戶為了提高或降低某些對象的推薦概率,惡意捏造用戶評分數據而達到目的)將是未來推薦系統的一個重要研究方向。

2.2 模型過擬合問題

過擬合現象是指系統推薦給用戶的對象與用戶剛剛看過的不是太相似或者太不相關。過擬合(過學習)的問題本質上來自于數據的不完備性,這在實際應用中是無法完全避免的。在于興趣偏好獲取方式或隱私等原因使用戶沒有對足夠多類別的對象進行評價。目前解決的主要方法是引入隨機性,使推薦算法收斂到全局最優或者逼近全局最優,關于既要保證推薦的多樣性,又不能與用戶看過的對象重復或毫不相關這一問題的研究是推薦系統研究的一個難點和重點。

2.3 稀疏性與冷啟動問題

稀疏性和冷啟動問題困擾推薦系統很長時間了,前者的解決辦法主要過濾和降維。目前針對冷啟動問題提出了一些解決方法,主要分為兩大方面,一是直接利用傳統協同過濾的評分數據結合特定的方法進行解決,二是新用戶或新項目的內容屬性信息與傳統的協同過濾評分數據相結合的方法進行改善冷啟動問題。稀疏性與冷啟動問題一直是推薦系統研究的一個難點和重點。

2.4 數據挖掘的結果和算法智能服務化

將數據挖掘算法融入針對海量用戶的使用記錄和計算資源間協作進行優化組合,利用這些特性通過大眾參與的交互作用,提高云間服務的智能性、有效性將是大數據時代推薦系統研究的一個制高點。將數據挖掘任務及其實現算法服務化,通過SaaS方式向云計算中心索取所需的相應的數據挖掘,這可能是目前突破數據挖掘專用軟件使用門檻過高、普通大眾難以觸及、企業用戶使用成本太大、挖掘算法和結果難以實時得到評價和相應修改等問題的最有希望的解決方案之一,也是數據挖掘走向互聯網大眾、走向實用化的重要的一步。

2.5 大數據處理與增量計算問題

目前對大數據的研究仍處于一個非常初步的階段,半結構化和非結構化數據給傳統的數據分析帶來巨大挑戰,尤其算法如何快速高效地處理推薦系統海量和稀疏的數據成為迫在眉睫的問題。當產生新的數據時,算法的結果不需要在整個數據集上重新進行計算,而只需考慮增量部分,對原有的結果進行微調,快速得到準確的新結果,是增量計算的理想狀態。但一般而言,隨著信息量的增多,算法的誤差會累積變大,最終每過一段時間還是需要利用全局數據重新進行計算。一個特別困難的挑戰是如何設計一種能夠保證其誤差不會累積的算法,也就是說其結果與利用全部數據重新計算的結果之間的差異不會單調上升,要達到這種程度,還有很長的路要走。

結束語:

隨著新一代信息技術的快速發展和信息內容的日益增長,搭載在云計算平臺的自組織區域推送具有它天然的優勢:云的海量存儲使得推薦系統能有效獲取訓練數據;云的分布式計算能力提供了較高的響應能力;海量用戶的使用記錄和計算資源問大眾參與的交互涌現,最終形成自組織優化組合的智能個性化云推送。因此,農業云自組織區域推送具有重要的研究意義和廣闊的應用前景,對云環境下其他領域的個性化推送應用具有借鑒意義,但目前存在大量問題需要進行深入細致的研究。

參考文獻

[1]孟祥武,胡勛,王立才,張玉潔,移動推薦系統及其應用[J],軟件學報,2013,24(1):91-108

[2]楊濤,基于本體的農業領域知識服務若干關鍵技術研究[D],上海:復旦大學計算機科學技術學院博士論文,2011,1-50

[3]楊曉蓉,分布式農業科技信息共享關鍵技術研究與應用[D],北京:中國農業科學院博士學位論文,2011,3-35

[4]趙春江,農業智能系統[M],北京:科學出版社,2009,1-210,

[5]何清,物聯網與數據挖掘云服務[J],智能系統學報,2012,7(3):1-5,

[6]黃衛東,于瑞強,共享學習模式下知識服務云平臺的構建研究[J],電信科學,2011,12:6-11

[7]丁靜,楊善林,羅賀,丁帥,云計算環境下的數據挖掘服務模式[J],計算機科學,2012,39(6):217-219,237

[8]鄧仲華,錢劍紅,陸穎雋,國內圖書情報領域云計算研究分析[J],信息資源管理學報,2012,2:10-16

[9]胡安瑞,張霖,陶飛,羅永亮,基于知識的云制造資源服務管理[J]同濟大學學報(自然科學版),2012,40(7):1093-1101

[10]程功勛,劉麗蘭,林智奇,俞濤,面向用戶偏好的智能云服務平臺研究[J],中國機械工程,2012,23(11):1318-1323,1336

[11]劉波,方逵,沈岳,可重構的農業知識服務模式研究[J]農機化研究,2011,36(11):66-70

[12]趙星,廖桂平,史曉慧,陳誠,李文圃,物聯網與云計算環境下的農業信息服務模式構建[J],農機化研究,2012,4:142-147

[13]郭永田,中國農業農村信息化發展成效與展望[J],電子政務,2012,02-03:99-106

[14]李道亮,中國農業農村信息化發展報告(2011)[M],北京:電子工業出版,2012,87-150

[15]錢平,鄭業魯,農業木體論研究與應用[M],北京:中國農業科學技術出版社,2006,1-100

[16]吳麗花,劉魯,個性化推薦系統用戶建模技術綜述[J],情報學報,2006,25(2):55-62

[17]李珊,個性化服務中用戶興趣建模與更新研究[J],情報學報,2010,29(1):67-71

[18]王國霞,劉賀平,個性化推薦系統綜述[J],計算機工程與應用,2012,48(7):66-76

[19]王巧容,趙海燕,曹健,個性化服務中的用戶建模技術[J],小型微型計算機系統,2011,32(1):39-46

軟件雜志歡迎推薦投稿:http:///

[20]張華清,動態多維社會網絡中個性化推薦方法研究[D],濟南:山東師范大學碩士學位論文,2012,16-31

[21]丹,面向跨系統個性化服務的用戶建模方法研究[J]_情報雜志,2012,31(6):156-161

[22]鄧夏瑋,基于社交網絡的用戶行為研究[D],北京:北京交通大學碩士學位論文,2012,4-43

[23]馬堯,基于多維用戶特征建模的個性化社交搜索引擎的設計與實現[D],廣州:華南理工大學碩士學位論文,2012,12-55

[24]陳恩紅,徐童,田繼雷,楊禹,移動情景感知的個性化推薦技術[J],中國計算機學會通訊,2013,9(3):19-24

[25]Jong Hwa Kima,b,,Hyun JoonLeeb,Extraction of user profile based on workflow and information flow[J],Expert Systems with Applications,2012,39(5):5478-5487

[26]南智敏,錢松榮,引入漂移特性的用戶興趣模型優化研究[J],微型電腦應用,2012,28(3):30-32

[27]郭新明,弋改珍,混合模型的用戶興趣漂移算法[J],智能系統學報,2010,5(2):181-184

[28]程顯毅,朱倩,文本挖掘原理[M],北京:科學出版社,2010,9-45 [29]李濤,推薦系統中若干關鍵問題研究[D],南京:南京航空航天大學博士學位論文,2009,31-80

[30]姜倫,模糊聚類算法及其在中文文本聚類中的研究與實現[D],哈爾濱:哈爾濱理工大學碩士學位論文,2010,18-48

[31]馮汝偉,謝強,丁秋林,基于文本聚類與分布式Lucene的知識檢索[J],計算機應用,2013,33(1):186-188

[32]陶紅,周永梅,高尚,一種基于語義相似度的群智能文本聚類的新方法[J]計算機應用研究,2012,29(2):482-532

[33]孟海東,劉小榮,基于聚類分析的圖模型文檔分類[J]計算機應用與軟件,2012,29(1):117-174,229

[34]饒君,張仁波,東呈曉,吳斌,基于MapReduce的大規模圖挖掘并行計算模型[J],應用科技,2012,39(3):56-60

[35]于戈,谷峪,鮑玉斌,王志剛,云計算環境下的大規模圖數據處理技術[J],計算機學報,2011,34(10):1753-1767

[36]呂善國,吳效葵,曹義親,基于網絡結構的推薦算法[J]_實驗室研究與探索,2012,31(7):278-280,368

[37]周佳,羅鐵堅,一種基于內容關聯的學術資源協同推薦算法[J],中國科學院研究生院學報,2013,30(1):117-123

[38]唐曉波,張昭,基于混合圖的在線社交網絡個性化推薦系統研究[J]情報理論與實踐,2013,36(2):91-95

[39]王立才,孟祥武,張玉潔,上下文感知推薦系統[J],軟件學報,2012,23(1):1-20

[40]劉建國,周濤,汪秉宏,個性化推薦系統的研究進展[J],自然科學通報,2009,19(1):1-15

[41]許海玲,吳瀟,李曉東,閻保平,互聯網推薦系統比較研究[J]軟件學報,2009,20(2):350-362

[42]孫冬婷,何濤,張福海,推薦系統中的冷啟動問題研究綜述[J],計算機與現代化,2012,5:59-63

[43]張亮,基于聚類技術的推薦算法研究[D],成都:電子科技大學碩士學位論文,2012,7-18

[44]Liu, F.,Lee, H.J. Use of social network information to enhance collaborative filterinperformance.Expert[J] Systems with Applications. 2010, 37(7):4772-4778.

[45]Jiang, J., Lu, J., Zhang, G., Long, G. Scaling- Up Item-Based CollaborativeFiltering Recommendation Algorithm Based on Hadoop[C].2011 IEEE World Congress onServices.IEEE[A]. 2011, 490-497.

[46]周源,基于云計算的推薦算法研究[D],成都:電子科技大學碩士學位論文,2012,26-64

[47]呂雪驥,基于云計算平臺的智能推薦系統研究[D],合肥:安徽大學碩士學位論文,2012,25-43

[48]劉晨,改進的聚類挖掘算法對網絡自助出版“長尾”文本的推薦應用[D],上海:復旦大學碩士學位論文,2011,10-19

[49]陳桂生,張海粟,劉玉超,云計算下的個性化數據挖掘服務[EB/OL],[2011-2-28]中國人工智能學會通訊,http://www,/contents/50/119,html

[50]張澤華,云計算聯盟建模及實現的關鍵技術研究[D],昆明:云南大學博士學位論文,2012,26-114

[51]郭昱,吳清烈,基于云計算的大規模定制客戶需求響應模型及其節點的選擇與分布[J],系統工程理論與實踐,2011,31(增刊2):1-6

[52]趙東杰,張海粟,韓言妮,楊海濤,何宇,基于網絡化數據挖掘的群體智能研究方法[C],Proceedings of 2010 The 3rdInternational Conference on Computational Intelligence andIndustrial Application(Volume 9).IEEE[A].2010,239-243.

[53]AnandRajaraman,Jeffrey David Ullman著,王斌譯,互聯網大規模數據挖掘與分布式處理[M],北京:人民郵電出版社,2012,1-253

[54]Bhaduri K, Das K, Liu Kun, et al. Distributed data mining bibliography[EB/OL]. [2011-01-03]. http:// cs. umbc. edu/~hillol/DDMBIB/

[55]楊健,汪海航,王劍,俞定國,云計算安全問題研究綜述[J],小型微型計算機系統,2012,33(3):472-479

篇10

關鍵詞:數據挖掘 客戶關系管理 企業發展

企業管理中客戶關系的管理必不可少,并且良好的管理有利于企業發展,有利于企業獲取更大的財富,有利于企業實現自己的價值,所以保障對企業客戶關系的管理。數據挖掘技術就是一個可以幫助企業對客戶關系進行有效的管理的工具。

一、數據挖掘和客戶關系管理含義

數據挖掘技術(Data Mining可以簡稱為DM),簡單來說,就是一種把隱藏在大型數據庫或者數據倉庫中所需要的有用信息提取出來的新技術,這是一個對數據庫進行研究的非常有價值的領域。數據挖掘技術可以幫助用戶從數據庫中準確的提取出有用的商業信息,為用戶在進行決策時提供重要的支持。

客戶關系管理(Customer Relationship Management可以簡稱為CRM),也有人稱之為“顧客關系管理”,關于客戶關系管理的定義,目前有兩種說法:一,最早的Gartner Group定義為一種商業策略,就是把客戶進行分類,并依據分類情況來對企業的資源進行有效的組織,進而企業的業務流程實施以及經營活動都要以客戶為核心來進行,以此來提高企業的盈利能力以及客戶滿意度,取得最大利潤;二、是由CRMguru.com給出的定義,客戶關系管理就是一個在企業的營銷、銷售以及服務的業務范圍內,把企業現有的客戶以及潛在客戶,還有業務伙伴多渠道進行管理的過程,或者說技術。

二、數據挖掘在客戶關系管理中的應用

隨著社會經濟的不斷發展,市場競爭力也在逐步的增大,商家想要獲得最好的利益,就必須對市場的變化迅速的做出反應,能夠引起市場變化的重要因素就是客戶需求的變化,也就是說,企業必須集中注意力,觀察客戶需求的每一變化,并把這些資料收集在一起,作為企業發展的寶貴資源進行管理。在企業管理客戶信息的過程中,就需要應用到了數據挖掘技術。

數據挖掘技術在客戶關系管理中的應用過程中,主要方法有:神經網絡法、遺傳算法、決策樹法、粗糙決算法以及可視化技術、K—最近鄰技術等,每個公司的客戶關系不同、需求也不同,所以要用到的方法也不同。

數據挖掘技術主要應用于客戶關系管理中的這幾個方面:(1)挖掘新客戶,數據挖掘技術可以對現有的客戶信息和市場環境進行統計總結以及歸納,準確的確定潛在客戶以及市場目標。因為數據挖掘技術具有統計、聚類和關聯的作用,比如說,數據挖掘技術在數據庫中發現了這樣一個信息“某客戶在購買A商品之后,過了一段時間又購買了B商品,最后還購買了C商品”那么數據挖掘技術就會通過次序關聯,把這個信息形成“A—B—C”的行為模式。(2)可以保持優質客戶?,F在社會競爭相當激烈,企業客戶更是企業發展的重要因素,優質客戶對每個企業來說就更加的重要。數據挖掘技術可以對數據庫中的流失客戶信息進行分析,并且對流失客戶的特征進行準確的描述,然后利用關聯、近鄰的方式對整個數據庫中的消費客戶信息進行分析,分析出容易流失的客戶,隨后就需要采取相應的措施來減少這些客戶的流失,尤其是那些可能流失的優質客戶,更要采取有力的措施來進行挽留。(3)可以提升客戶價值。目前提升現有客戶的價值的方式有兩個:一是提供特色服務或者產品;二是銷售新產品或者服務。想要準確的提升客戶價值,就需要數據挖掘技術的幫助了,他可以把之前的客戶信息研究分析,并依據新產品或者服務的特征,發現和客戶的已購買產品之間的關聯,因而準確的找到具有最大購買趨勢的客戶。

三、加強客戶關系管理中數據挖掘的意義

應用數據挖掘技術對客戶關系進行管理,可以有效的提高企業的核心競爭力,現代社會的激烈競爭,也就是對客戶的競爭,數據挖掘技術對企業的客戶關系進行詳細的分析,并為企業提供有價值的商業信息,為企業的重大決策提供了重要的參考依據,進而有力的提高了企業的核心競爭力;可以有力的增強企業的執行力,利用信息技術對客戶關系進行管理,降低成本,并簡化執行任務,有效的實現了資源共享,大力的提高了企業的自動化水平,企業職工的執行能力也進一步得到了提高,也就是增強了企業的執行力[3];可以為企業的下一步戰略發展提供幫助,數據挖掘技術對現今的市場環境進行分析,可以預測到每個業務的發展狀態,以及每個業務與發生過的商業行為之間的關系,有了這些信息,可以準確的制定企業未來的發展戰略,并且可以制定與市場環境相適應的營銷策略。

綜上所述,目前數據挖掘技術是企業進行客戶關系管理的最有效的工具,準確的掌握了客戶信息,就是準確的把握了市場需求,可以為企業制定完全適應于市場的發展方向。數據挖掘技術的關鍵作用就是找出潛在客戶,保留忠誠客戶,并利用企業有限的資源,對這些客戶提供最好的服務,促進企業的不斷發展。

參考文獻:

[1]張榮耀.基于數據挖掘的客戶關系管理研究[D].武漢理工大學, 碩士學位論文,2004,11