生態農業數據挖掘技術應用

時間:2022-04-01 10:01:02

導語:生態農業數據挖掘技術應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

生態農業數據挖掘技術應用

1數據挖掘的定義和方法

數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取出隱含在其中的、新穎的、未知的、但又有潛在有用的高質量的信息。數據挖掘是面向應用的。它不僅是面向特定數據庫的簡單檢索查詢調用,而且要對這些數據進行微觀和宏觀的統計、分析、綜合和推理,發現事件間的相互關聯關系,利用已有的數據對未來的活動進行預測[4]。數據挖掘常用的技術有:統計分析技術,包括線性分析和非線性分析、回歸分析、邏輯回歸分析、單變量分析、多變量分析、時間序列分析、最近鄰算法和聚類分析等技術[5];知識發現類技術,包括人工神經網絡、決策樹、遺傳算法、粗糙集、規則發現和關聯順序等。應用這些技術可完成對數據特征化區分,關聯分析,分類和預測,聚類分析、演變分析等挖掘功能。在實際應用中,應結合具體應用領域將多種技術相結合,以期獲得最佳的挖掘質量和效果。

2數據挖掘實施過程

數據挖掘實施過程分為以下4個步驟[6]。

2.1數據定義和數據清洗

創建元數據,定義相關領域,填寫空缺值、平滑數據噪聲、識別刪除孤立點以及處理不一致數據。

2.2數據聚集和數據挖掘模型開發

集成多個數據庫、立方體和文件的數據。對數據進行概化(用高層次的概念代替低層次的原始數據)、規范化(將屬性數據按一定的比例縮放到特定區間)、屬性構造、數據歸約(刪除弱相關的屬性、數據濃縮)。選擇知識發現的方法,確定模型。

2.3數據挖掘

運用確定的數據挖掘模型,從數據中提取出用戶需要的知識,用某種特定的方式表示或使用常用的表示方式,以滿足用戶的需求,使數據挖掘工作效用最大化。

2.4知識評估

知識評估包括解釋、推演及模型調整。可將發現的知識以用戶需求的方式進行表現,根據用戶需求對過程中的某些處理階段進行優化,直至最大限度地滿足用戶的需求。

3生態農業

“生態農業”(EcologicalAgriculture)一詞最初是由美國土壤學家W.Albreche于1970年提出的。1981年英國農學家MWorhtington將生態農業明確定義為“生態上能自我維持、低投入,經濟上有活力,在環境、倫理和審美方面可接受的小型農業”[7]。中國生態農業(ChineseEcologicalAgriculture)具有深厚、古老的農業傳統背景和基礎,有其本身一定的發生發展過程,具有獨特的個性,即不否定化肥、農藥、激素等的適當投入,追求技術和能量的高效,并具有勞力密集和技術密集相結合的特征。中國生態農業是在傳統農業的基礎上發展起來的,精耕細作、培肥地力、間套輪作、林糧間作、基塘種養、農牧結合等傳統農業精華與現代化技術相結合,逐步發展成為具有中國特色的農業綜合生產體系[8]。我國生態農業是綜合運用了人與自然的關系原理,以生態學、生態經濟學、生物學、社會學等理論為基礎,采用系統工程方法和先進科學技術成就,以研究生態經濟協調發展,合理利用自然資源、保護生態環境為主題,以實現農業和農村經濟持續協調發展為目的,強調生態效益,兼顧經濟效益和社會效益的新型農業發展模式[9]。現代高新技術會更加廣泛地滲透于生態農業中由于生態農業所追求的目標是高效益和無污染,而要實現這個目標就必須更多地依靠現代高新技術[10]。

4數據挖掘技術在生態農業上的應用

農業是一巨型復雜系統。我國土地遼闊,土壤類型眾多,作物品種復雜,病蟲害發生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關系和影響,許多還未被人們去認識,然而所積累的數據之多是任何一個領域所沒有的,它具有大量、多維、動態、不完整、不確定等特性。由于農業自身的一些特點,如:土壤類型眾多,作物品種復雜,病蟲害發生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關系和影響,就使得關于它們的數據庫與知識庫具有大型、多維、動態、不完全(缺值)、不確定(數據中的系統或隨機噪聲)、稀疏性(很少甚至沒有有用的記錄)等特征[11]。因此,數據挖掘工具應能處理農業數據的這些特征。另外,農業數據還有另外一個特征,它的測量與時間有關,在數據分析過程中要求考慮時間因素,以便進行預測。目前及今后數據挖掘技術在生態農業中的應用主要集中在以下幾個方面。

4.1生態農業類型研究的應用

通過長期生態定點觀測站,包括農田生態系統、草地與荒漠生態系統、森林生態系統以及湖泊濕地海灣生態系統各野外觀測站的長期監測數據(包括生物、土壤、水分和氣象四個部分)信息、觀測樣地信息與水分、土壤、大氣和生物監測信息以及相關研究成果的數據。構建相關數據庫,利用數據倉庫技術和數據挖掘技術對大量積累的數據進行挖掘,運用序列分析、聚類分析和關聯分析對生態農業類型相關因子進行綜合分析,開展不同生態農業類型結構與功能的研究。

4.2生態農業分類體系研究的應用

生態農業的分類體現出區域特點,生態農業建設區域類型是結合本地自然條件建設的具有地區特色、符合生態規律和經濟規律的區域生態經濟系統。具體可分為以下九類:水田生態農業、旱地生態農業、山地生態農業、水域生態農業、低地生態農業、草地生態農業、園地生態農業、庭院生態農業、村鎮生態農業。在每一生態農業建設區域類型中、根據生態農業系統的結構和功能分為4個生態農業系統結構類型、即平面結構型、立體結構型、時序結構型、鏈式結構型。開展對現有生態農業類型進行全面調查,采集各類生態農業類型的地貌、土壤、水文、氣候等環境因子數據,利用數據挖掘技術的關聯規則和粗糙集技術,可以確定生態農業類型的關鍵因子,排除干擾因子。通過相關統計模型,可以確定各區域生態農業類型的相似拐點,從而得到適應不同地區特點的生態農業類型優化方案。

4.3生態農業布局研究的應用

地理信息系統(GIS)技術用于國家和地區范圍內農業相關的評估已有多年[12]。很多特定的農場系統利用GIS和一些相關技術來收集空間參考數據,進行空間分析和制定決策,作物狀況和收成、土地能力、土壤侵蝕、土壤密度、地表和地下水污染、蟲害襲擊、雜草清除和氣候變化影響的評估,空間數據挖掘技術是DM技術的分支,是數據挖掘的主要研究方向之一,是KDD(KnowledgeDiscoveryinDatabase)技術在空間數據庫方面應用的延伸。空間數據挖掘技術的應用一般可使GIS查詢和分析技術提高到發現知識的新階段,另一方面,從中發現的知識可構成知識庫用于建立智能化的GIS系統,地理信息系統技術與空間數據挖掘技術的集成能夠更好開展生態農業布局研究,挖掘影響生態農業合理布局的關鍵因子,逐步實現生態農業的合理布局。

4.4生態農業評價方法的應用

參照現階段我國生態農業建設的規模和發展方向,運用層次分析法(簡稱AHP)和模糊數學等系統分析方法進行研究,給出了一套以定量為主、定性與定量相結合的簡便易行的生態農業綜合效益評價指標體系與評價方法,將生態農業的綜合效益分為生態效益、經濟效益和社會效益三個方面(也即三個準則),并將諸方面分解為若干具體指標[13]。形成具有一個總目標、三項準則(子目標)和18個具體指標的三層次生態農業綜合效益評價指標體系。通過對指標體系的數據進行量化,構建數據庫,利用數據挖掘工具和統計模型以及神經網絡技術,對數據庫的數據仔細研究,可以挖掘出評價指標之間的相關性,設置合理的指標權重,根據評價年效益指數和相對指數的高低作出對生態農業系統綜合效益的分析判斷。進一步探討生態農業評價方法

5結束語

從農業現代化走向農業信息化是農業發展的必然規律。數據挖掘是一個新興的、潛力巨大的研究領域。生態農業領域的數據挖掘是計算機技術人工智能和統計學等與現代農業相結合的產物。數據挖掘技術在生態農業領域的應用還處于起步階段,對它的理解和認識還需要一個過程,具體應用方案和技術還需要不斷探索和研究。數據挖掘只是根據純數據之間的關系挖掘出一定的決策模型,但它無法完成實現對結果的解析,只是給研究和應用人員提供一個強大的工具,因此必須將它和現有的工具結合起來,才能夠使模型更完備和成熟。數據挖掘技術作為具有潛力巨大的研究領域,通過與現代農業相結合,將在農業科研、生產、管理等方面發揮巨大的作用,這對推動我國農業現代化的發展具有重要的作用。

作者:劉暉林永輝林怡工作單位:福建省農業科學院農業生態研究所福建省山地草業工程技術研究中心