梯度下降法的基本原理范文

時間:2023-11-14 17:40:51

導語:如何才能寫好一篇梯度下降法的基本原理,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

梯度下降法的基本原理

篇1

關鍵詞:人工神經網絡 反向傳播算法 故障診斷

1 引言

隨著經濟的發展,空調系統得到了越來越廣泛的應用,空調設備已成為重要的生活必備品之一。這就要求空調系統可靠性高且功能齊全,而且在故障診斷維修服務方面達到一定的水平。國內目前的大部分空調系統中無故障診斷系統,當空調系統出現故障后,維保人員往往不能及時、準確地了解系統出現故障的原因及相關信息,空調系統無法得到及時修復,這種情況急需得到改善。

2 關于故障診斷技術

故障診斷FD(fault diagnosis)是一種了解和掌握設備在使用過程中的技術,確定其整體或局部是否正常,早期發現故障及其原因并能預報故障發展趨勢的技術。在診斷過程中,必須利用被診斷對象表現出來的各種有用信息,經過適當地處理和分析,做出正確的診斷結論。在制冷暖通空調領域,1987年在彥啟森教授的建議下,才開始了故障診斷專家系統在制冷暖通空調領域的研究應用[1]。

3 人工神經網絡用于空調系統故障診斷的基本原理

人工神經網絡(Artificial Neural Network.簡稱ANN)正是在人類對其大腦神經網絡認識理解的基礎上人工構造的能夠實現某種功能的神經網絡。它是理論化的人腦神經網絡的數學模型,是基于模仿大腦神經網絡結構和功能而建立的一種信息處理系統。它實際上是由大量簡單元件相互連接而成的復雜網絡,具有高度的非線性,能夠進行復雜的邏輯操作和非線性關系實現的系統。

典型的神經網絡結構如圖1所示。

在眾多的人工神經網絡模型中,最常用的是BP(Back Propagation)模型,即利用誤差反向傳播算法求解的多層前向神經網絡模型[2]。BP網絡在故障診斷、模式識別、圖像識別、管理系統等方面都得到了廣泛的應用。本文討論利用神經網絡中的BP模型進行空調系統的故障診斷。

首先需要進行知識的獲取。由專家提供關于各種空調系統故障現象(征兆集)及相應的故障原因(故障集)實例作為學習樣本。將數據分為兩部分,一部分用于訓練網絡,另一部分用于測試。將訓練網絡的數據按一定順序編碼,分別賦給網絡輸入、輸出節點,通過神經網絡學習算法對樣本進行學習,經過網絡內部自適應算法不斷修正權值,直到達到所要求的學習精度為止。此時在大量神經元之間聯結權值上就分布著專家知識和經驗。訓練完畢后,再將測試網絡的數據從初始狀態出發,向前推理,將顯示出的故障結果與實際的測試數據結果相比較,如果誤差很小,說明網絡的權值建立正確;如果誤差較大,說明網絡的權值建立有誤,需要重新進行網絡的訓練。

將訓練樣本訓練完畢后,即可進行空調系統的故障診斷。只要實際輸入模式接近于某一個訓練時的學習樣本的輸入模式,則可產生出接近學習樣本的輸出結果,也就是所謂的自聯想功能。同時,由于網絡計算上的大量并行性,當機器運行狀況改變,出現網絡學習未考慮的情況時,系統亦能給出正確分類結果。同時將新數據并入網絡,實現系統的自適應。一般來說,學習的故障實例樣本越多,診斷結果的準確率越高。

4 BP學習算法

BP算法因其簡單、易行、計算量小、并行性強等優點,是目前神經網絡訓練采用最多也是最成熟的訓練算法之一。BP算法的實質是求解誤差函數的最小值問題,由于它采用非線性規劃中的梯度降法(Gradient Descent),按誤差函數的負梯度方向修正權值 [3]。其主要思路是如果求出訓練網絡的指標函數誤差:

一般的BP算法稱為標準誤差逆傳播算法,也就是對應每一次輸入都校正一次權值。這種算法不是全局誤差意義上的梯度下降計算。對各個神經元的輸出求偏導數,那么就可以算出誤差對所有連接權值的偏導數,從而可以利用梯度下降法來修改各個連接權值。真正的全局誤差意義上的梯度下降算法是在全部訓練模式都學習完后才校正連接權和閾值。其計算流程如圖2所示:

5 故障診斷實例 5.1 空調系統故障診斷的BP網絡建立

空調系統故障模式及故障機制分析[4]如表1所示

表1 空調系統故障模式及故障機制分析 表示

符號

表示

符號

房間溫度均偏高

1.冷凍機產冷量不足

2.噴水堵塞

3.通過空氣處理設備的風量過大,熱交換不良

4.回風量大于送風量

5.送風量不足(可能空氣過濾氣堵塞)

6.表冷器結霜,造成堵塞

相對濕度均偏低

7.室外空氣未經加濕處理

系統實測風量大于設計風量

8.系統的實際阻力小于設計阻力

9.設計時選用風機容量偏大

房間氣流速度超過允許流速

10.送風口速度過大

篇2

關鍵詞:人臉檢測;BP網絡;遺傳算法;GABP網絡

中圖分類號:TP183 文獻標識碼:B 文章編號:1004373X(2008)1615403

Face Detection Based on GABP Neural Network

JIAO Libao,PENG Yan,CHEN Chunlan

(Sichuan University of Science &Engineering,Zigong,643000,China)

Abstract:The constringency of the conventional BP neural network algorithm is too slow and local constringency is not ideal,which effect working performance.The lack above and face image data too big,a new method that the face detection method based on GABP neural network is introduced in this paper.Making the Genetic Algorithm (GA) search algorithm is used to train the network with updating the weights to minimize the error between the network output and the desired output.Then the BackPropagation (BP) algorithm is used to further train the artificial neural network used for face detection.The experiment indicate This network convergence rate is not only quick,moreover easy to achieve the optimal solution.This network has the high detection precision to the face image detection.

Keywords:face detection;BP neural network;genetic algorithm;GABP neural network

1 引 言

人臉檢測是圖像處理和識別領域的一個重要研究的課題,具有廣泛的應用價值,例如檔案管理系統、人機交互、駕駛執照、身份證的識別檢測,刑偵破案中犯罪嫌疑人照片的識別等,可以說人臉檢測是一種重要的個人身份鑒別的方法。本文將神經網絡和遺傳算法有機的結合起來,建立了一種遺傳神經網絡,然后利用優化后的神經網絡較好地解決人臉檢測中往往存在的噪聲、殘缺和戴眼睛的人臉圖像等。GABP網絡的應用于人臉檢測具有檢測速度快、檢測精度高等特點。

2 遺傳算法對BP網絡的優化

2.1 BP神經網絡的基本原理

BP(Back Propagation,反向傳播)網絡是神經網絡的一個分支,又稱誤差信號反饋網絡[1]。誤差反向傳播的BP算法簡稱BP算法,其基本思想是有導師學習,可按梯度下降法實現快速收斂。典型的BP網絡是3層前饋階層網絡(如圖1所示),即輸入層、隱含層(中間層)和輸入層。一個3層的BP網絡可以完成任意的n維到m維的非線性映射。

圖1 BP網絡結構BP算法的學習過程由正向傳播和方向傳播組成。在正向傳播過程中,輸入信息從輸入層經隱含層逐層處理,并傳向輸出層,每層神經元(節點)的狀態只影響下一層神經元的狀態。如果在輸出層不能得到期望的輸出,則轉至方向傳播,將誤差信號(理想與實際輸出之差)按連接通路反向計算,由梯度下降法調整各層神經元的權值,使誤差信號減小。神經網絡理論已經證明BP網絡具有強大的非線性映射的能力,一連續函數或映射均可采用3層網絡加以實現。

假設訓練集包含M個樣本,中間層的單元數是L,對第P個訓練樣本(p=1,2,…,M),單元j的實際輸出為opj,它的第i個輸入為opi,則:Upj=∑Ni=0WjiOpj。

其中Wji為神經元i與神經元j之間的連接權值。隱層神經元的輸出采用S 函數激發:Opj=f(upj)=11+exp(-upj);

誤差性能指標函數為:E=∑PEp;其中EP=12∑jdpj-Opj.2;式中,dpj表示對P個訓練樣本,單元j的期望輸出。訓練網絡的目的是找到一組權重,使誤差函數極小化。根據梯度下降法,輸出層及隱含層連接權值學習算法為:

若權值的變化量記為ΔWij,取ΔWij正比于-EPWji,即ΔWij=ηδpjOpj;其中η為學習因子(可調整權值),令-EPuji=δpj,則EPWji=EPupiupjWji=EPujiOpj=-δpjOpj。用θi和φj分別表示輸出單元和隱含層的閾值。其閾值變化分別記為Δθi和Δφj,г蜚兄滴:ИЕ泉i(n+1)=θi(n)+Δθi(n);

φj(n+1)=φj(n)+Δφj(n)И2.2 GABP網絡

遺傳算法GA (Genetic Algorithm)是基于生物進化原理的一種具有魯棒性的自適應優化方法[2]。遺傳算法遵循通過基于問題樣本適應度函數對初始群體選擇、交叉和變異操作,來指導學習和確定搜索的方向。由于采用種群的方式組織搜索,所以它可以在全局解空間內的多個區域內尋求最優解[3],而且特別適合大規模并行處理。對于BP網絡來說,也存在著不足,BP算法從本質上講屬于梯度下降算法,因而不可避免的具有一些缺陷,如:易陷入局部極小點[4] 、訓練速度慢[5]等。還有初始隨機加權的大小,會對局部最小部分產生很大的影響[6]。在優化問題中,如果目標函數是多峰的,或者搜索空間不規則,就要求所使用的算法必須具有高度的魯棒性,以避免在局部最優解附近徘徊[7]。所以遺傳算法和BP網絡的結合正好優劣互補。遺傳算法和神經網絡的結合對于尋求全局最優解其效果要優于單個的使用遺傳算法或神經網絡,為充分結合遺傳算法和BP神經網絡的長處提出了GA對BP的優化,從而獲得網絡的最優設計的新方法。

由于遺傳算法的搜索不依賴梯度信息,也不需要求解函數可微,只需要求解適應度函數在約束條件下可解。 并且遺傳算法具有全局搜索的特性,用遺傳算法優化神經網絡的連接權和網絡結構,可以較好地克服BP神經網絡結構確定過程中所帶來的網絡振蕩,以及網絡極易陷入局部解問題,并且有效提高神經網絡的泛化能力。因此,利用遺傳算法全局性搜索的特點,尋找最為合適的網絡連接權和網絡結構的方法來改變BP算法依賴梯度信息的指導,從而達到對網絡結構和網絡連接權值、閥值的最優配置。

通過使用GA在由BP網絡初步確定的基本解空間上(網絡連接權和神經元閥值的取值范圍) ,通過對基因的選擇,交叉變異操作。對樣本個體不斷擇優進化,直至進化K(總的進化代數由初始時給定)代后,選取個體中適應度最大的個體來確定網絡的結構和網絡的權值和閥值。

GABP優化算法步驟描述如下:

(1) 確定網絡結構;

(2) 產生初始種群;

(3) 輸入訓練樣本;

(4) 得到個體誤差,計算適應度值;

(5) 判斷是否滿足要求?是,則停止轉入(6);否,則繼續訓練,對網絡進行優化,產生新的閾值和權值;

(6) 得到GA優化的網絡。

從算法過程可以看出,GA優化BP網絡目的是確定網絡最優的權值和閾值,而在訓練過程中就是要不斷調整權值和閾值,直到總誤差函數是滿足條件,訓練結束,其GABP網絡訓練的流程圖(如圖2所示)。

圖2 GABP優化算法訓練流程3 GABP人臉檢測

這里采用ORL人臉數據庫進行仿真實驗。劍橋olivetli實驗室拍攝一系列人臉圖像,共有40人,每人有不同的表情或不同視點的10幅圖像,計400幅圖像(圖3為其中一些人臉樣本)。這些圖像為灰度圖像,傾斜角一般不超過20°,這里在每個人的10幅圖像中取5幅圖像作為訓練樣本對本系統進行訓練,并進行標準化,得到各點灰度值,送入GABP網絡訓練,調整權值和閾值,直到誤差足夠小或迭代到一定的次數,當訓練結束,將權值和閾值保存在文件中。在GABP網絡中,由于BP網絡中輸出值與期望的輸出值之間的誤差平方和EP越小,則表示該網絡性能越好,可以選擇一種適應度函數:f(x)=1EP+1。

圖3 部分ORL人臉樣本接下來將訓練好的網絡進行分類,裝載權值和閾值文件。選擇剩余的每個人5幅圖像用來分類,進行標準化,送入GABP網絡進行檢測。采用基于金字塔的子采樣過程,具體過程如下:首先將灰度圖像以1.2的比率重采樣縮小,而在每一級尺度變化中,以25×25的窗口大小,從上而下,從左到右掃描圖像,步長為2個像素,最后將該窗口內的625個像素點的灰度值送入已經訓練好的GABP網絡進行人臉的判別,這個過程循環往復,直到尺度變化后的圖象小于窗口大小為止。判別過程為:將數據輸入GABP網絡后,獲得2個輸出output(0)和output(1),如果output(0)大于output(1)則判斷為檢測正確,如果output(0)小于output(1)則判斷為檢測錯誤,最后計算出檢測精度,如圖4所示。

圖4 GABP人臉檢測流程 分別采用本文的算法和傳統BP算法,其識別結果為,如表1所示。

表1 兩種方法用于人臉檢測的效果對比

網絡類型收斂步數正確率傳統BP算法38189.5%GABP算法23693.73%

對2種方法用于人臉檢測的效果對比可以看出,基于GABP網絡的人臉檢測方法與傳統BP網絡的方法相比,檢測率高出4個百分點左右。此外,GABP優化的神經網絡在訓練過程中不斷的調整權值和與閾值,輸出網絡最優的權值和閾值,使總誤差函數

滿足條件,訓練結束。從而提高訓練速度,避免了在局部最優解附近徘徊。因此它的學習速度很快,在同等條件下,傳統的BP網絡收斂為381步,而GABP優化后的網絡僅為236步。

4 結 語

此文介紹一種GABP神經網絡的人臉檢測算法,通過實驗分析了該算法的性能。測試結果表明,該算法能明顯提高檢測精度,證明了遺傳算法優化的BP網絡在人臉檢測的實際應用中是可行的。

參 考 文 獻

[1]曾黃麟.智能計算[M].重慶:重慶大學出版社,2004.

[2]Golder G D.Genetic Algorithms in Search,Optimization and Machine Leam [M].London:AddisonWesley Pubishing Company Inc,1990.

[3]Bhatnv,Mcavoy T J.Determining Model Structure for Neural Models by Networks Tripping [J].Computer and Chem.Engng.,1992,16 (4):271281.

[4]潘昊,王曉勇,陳瓊,等.基于遺傳算法的BP經網絡技術的應用[J].計算機應用,2005,25(12):2 7772 779.

[5]李敏強,徐博藝,寇紀凇.遺傳算法與神經網絡的結合[J].系統工程理論與實踐,1999,(2):6569,112.

[6]樊為民.基于遺傳算法的神經網絡算法研究[J].太原師范學院學報:自然科學版,2004,3(4):1417.

[7]李建珍.基于遺傳算法的人工神經網絡學習算法[J].西北師范大學學報,2002,38(2):3337.

[8]陳耀明.小波變換在圖像數據壓縮中的應用\.現代電子技術,2007,30(6):136138.

作者簡介 焦利寶 男,1983年出生,河南新鄉人,碩士研究生。研究方向為人工智能控制及智能信息處理。

彭 男,博士研究生,教授,碩士生導師。研究方向為主要從事計算機應用、人工智能與智能控制、專家系統方面的研究。

篇3

【關鍵詞】數字通信;自動調制識別算法;研究

所謂的數字通信信號自動調制識別技術主要是對通信系統中的信號進行處理,包括:信號調制、信號檢測、信號提取等處理技術。自動信號自動調節識別技術在通信領域獲得了很大的發展,而且有很多的相關研究正在不斷的涌現。數字通信信號自動調制識別技術屬于非合作通信的基礎,在民用和軍用上都相當廣泛。

一、數字通信信號調制識別方法分類介紹

通常數字信號調制識別的方法有傳統兩大分類,一類為基于決策理論的最大似然識別法;二類為特征提取的統計模式識別算法。而在統計模式識別法則主要有模式識別以及特征提取等,根據不同的調制信號中的不同設計來識別所有的分類器[1]。特征提取常常是對信號頻譜、瞬時信號、均值、星座特征以及高階統計等進行主要特征進行提取。決策理論的方法中,主要利用假設檢驗以及概率等來描述調制模式的識別問題,通過最小的識別誤差來對調制模式進行檢測判斷,因此可將其劃分為最優分類器。

二、調制識別技術概念

(一)調制

所謂的自動調制識別算法中的調制主要是當消息在傳輸過程中由于存在著頻率較低的頻譜分量,且不利于信號的直接傳播,那么通信系統往往需要加入調制過程以此來達到信道調制的效果。調制技術可以對信號的頻譜進行搬遷,將通信信號的頻譜搬到既定的位置上,然后將通信信號轉換成為適合信道傳輸的信號[2]。調制技術的方法種類有很多,而且根據信號的類型可將調制方法分為數字信號調制和模擬調制;根據信號在調制之后的頻譜類型可分為線性調制以及非線性調制。線性調制是通過改變載波的幅度來達到對基帶調制信號的頻譜搬移,此時的信號也保持了基帶信號的結構和線性關系,所以線性調制也被稱為幅度調制。而非線性調制則是通過改變載波的頻率和相位來實現頻譜的搬遷,即始終保持載波的幅度不變,而載波的頻率和相位卻發生改變。

(二)識別

通信信號自動調制的識別主要是在進行信號調制的過程中清楚信號的調制參數以及信息內容等。可判斷出信號所采取的調制方式,同時還可以根據某些調制的信息來確定調制的參數,那么我們在進行調制的過程中選取適當的算法為計算提供準確的參數[3]。識別技術中其主要的核心為分類器設計、特征提取等,其征的提取主要是對信號進行分析,根據不同的信號的時頻域分析來進行特征識別。

三、自動調制識別算法探索

(一)自適應lr算法

Lr算法屬于BP神經網絡算法的一種,lr值本是固定不變的。但是自適應lr算法確有著其自變的規律,若計算過程中可以在較平坦的曲面提高lr,反而加速了收斂減少了lr。可以表示為:w(k+1)=w(k)-η(k)F(w(k))。據該公式可知,通調整η(k)可以獲得較之BP神經網絡更快的收斂速度。Lr算法中將動量和自適應lr梯度算法結合起來,可以有效的提升學習的效率,還能夠限制網絡陷入局部極小值。

(二)L-M算法

L-M算法主要是利用目標函數進行一階和二階求導,其迭代式子為:w(k+1)=w(k)-(JT(k)J(k)+uI)-1J(k)(w(k)),u表示阻尼因子;I表示單位矩陣;J(k)表示雅克比矩陣。L-M算法則是通過調節阻尼因子來對迭代收斂方向實現動態調整。該算法則是結合了牛頓法和梯度下降法進行快速收斂。

(三)RPROP算法

RPROP算法與BP神經網絡算法的改進有所不同,該算法在調整網絡的過程中主要是利用函數的誤差,針對閥值偏導數、網絡權值等進行符號替代,可以有效的提升收斂的速度,這就解決了BP神經網絡收斂速度慢的缺點[5]。RPROP算法在調整網絡的時候,可以先設置一個權更新值“”,則全修正值為w,其算法的計算公式為:

wij(t)=-(t) >0 (1)

wij(t)=+(t) <0 (2)

wij(t)=0 其他 (3)

式中,t表示訓練的次數,而RPROP算法則采用批處理方式進行訓練。

則表示在地t時訓練時,訓練集的所有模式梯度累加。權更新值ij則表示在i、j此訓練之后E上的梯度信息,更能夠適應于學習更新。則其公式為:

ij(t)=η+×ij(t-1)

>0 (4)

ij(t)=η-×ij(t-1)

<0 (5)

ij(t)=0 其他 (6)

從上述的(4)、(5)、(6)式子看出,如果E的梯度符號發生改變,則表示wij變化太大,則ij應該乘以η-,使之減小。如果E上的梯度符號不變,則隨著wij增大,ij應乘以η+,則可以有效的加速誤差曲面的收斂。

四、結束語

數字通信信號自動調制識別在合作和非合作領域具有非常重要的價值,而且已經成為了當前重要領域的研究熱點技術。隨著通信信息技術的快速發展,對于自動化的要求越來越高,因此針對數字通信信號自動化調制識別算法具有非常重要的意義,值得我們不斷進行研究。

參考文獻

[1]李敏.數字通信信號自動調制識別技術的研究[D].哈爾濱工程大學,2012.

[2]蘆躍.數字信號調制識別及參數估計研究[D].蘇州大學,2013.

篇4

關鍵詞: 回歸測試; 測試用例; 神經網絡; BP網絡

中圖分類號: TN711?34 文獻標識碼: A 文章編號: 1004?373X(2015)19?0114?03

Abstract: Regression testing means after modifying the source code, re?testing to confirm whether the discovered defect is repaired, and whether detection and modification have brought in a new bug or caused the errors in other codes which possesses a large proportion of the workload during testing procedure. The fundamental principle of neural network is analyzed, and the thought of BP algorithm is introduced into the case set selection of regression testing. The algorithm to select regression testing case package is presented. The functions which may be influenced by code modification are screened out by samples training, and the higher priority use case can be screened out. A set of regression testing strategy with high efficient and easy operation was summed up through the accumulation of testing practice.

Keywords: regression testing; testing case; neural network; BP network

0 引 言

軟件分析,設計過程中難免有各種各樣的錯誤,需要通過測試查找錯誤,以保證軟件的質量。軟件測試是由人工或計算機來執行或評價軟件的過程,驗證軟件是否滿足規定的需求或識別期望的結果和實際結果之間有無差別。大量統計資料表明,軟件測試工作量往往占軟件開發總量的40%以上。而回歸測試作為軟件生命周期的一個組成部分,在整個軟件測試過程中占有很大的工作量比重,軟件開發的各個階段都會進行多次回歸測試。在漸進和快速迭代開發中,新版本的連續使回歸測試變得更加頻繁,而在極端編程方法中,更是要求每天都進行若干次回歸測試。因此,研究回歸測試方法,盡可能地將軟件存在的問題找出來,對保證軟件質量和提升測試工作效率都是非常有意義的。

1 相關工作

1.1 回歸測試

回歸測試是指修改了舊代碼后,重新進行測試以確認修改沒有引入新的錯誤或導致其他代碼產生錯誤。對于一個軟件開發項目來說,項目的測試組在實施測試的過程中會將所開發的測試用例保存到“測試用例庫”中,并對其進行維護和管理。當得到一個軟件的基線版本時,用于基線版本測試的所有測試用例就形成了基線測試用例庫。在需要進行回歸測試時,就可以根據所選擇的回歸測試策略,從基線測試用例庫中提取合適的測試用例組成回歸測試包,通過運行回歸測試包實現回歸測試。

在軟件生命周期中,即使一個得到良好維護的測試用例庫也可能變得相當大,這使每次回歸測試都重新運行完整的測試包變得不切實際。一個完全的回歸測試包括每個基線測試用例,時間和成本約束可能阻礙運行這樣一個測試,有時測試工作不得不選擇一個縮減的回歸測試包來完成回歸測試。

1.2 相關技術的研究

測試用例的優化技術旨在以小的運行代價盡可能多地發現系統Bug。假設測試用例是能發現缺陷的;測試用例的運行效率是一樣的。測試用例的集合的選取不僅是減少用例的數目,降低用例的執行代價,也需要考慮測試覆蓋能力,即缺陷發現能力。在測試用例選擇優化的問題上,已有很多文獻對此進行了研究,如配對測試法[1]、關系樹模型[2]、蟻群模擬退火算法[3]及一些其他新的理論和方法[4?7]。

2 回歸測試用例集生成方法

2.1 基本原理

神經網絡是通過對人腦的基本單元――神經元的建模和聯接,探索模擬人腦神經系統功能的模型,并研制一種具有學習、聯想、記憶和模式識別等智能信息處理功能的人工系統。

神經網絡的一個重要特性是它能夠從環境中學習,并把學習的結果分布存儲于網絡的突觸連接中。神經網絡的學習是一個過程,在其所處環境的激勵下,相繼給網絡輸入一些樣本模式,并按照一定的規則(學習算法)調整網絡各層的權值矩陣,待網絡各層權值都收斂到一定值,學習過程結束,從而以新的方式響應環境。

2.2 BP神經網絡

Back?Propagation Network,由于其權值的調整采用反向傳播(Back Propagation)的學習算法,因此被稱為BP網絡。網絡中心思想是梯度下降法,通過梯度搜索技術,使網絡實際輸出值與期望輸出值的誤差均方值最小。網絡的學習過程是一種誤差邊向后傳播邊修正權系數的過程。一般分三層:輸入層(Input Layer),隱層(Hide Layer),輸出層(Out Layer),也可以有2層或更多個隱層。層與層之間采用全互聯方式,同一層單元之間不存在相互連接,如圖1所示。

由于神經網絡具有自學習、自組織和并行處理等特征,并具有很強的容錯能力和聯想能力,因此,神經網絡具有模式識別能力。在神經網絡識別中,根據標準的輸入輸出模式對,采用神經網絡學習算法,以標準的模式作為學習樣本進行訓練,通過學習調整神經網絡的連接權值。當訓練滿足要求后,得到知識庫,如圖2所示。

BP算法的具體步驟如下:

(1) 用小的隨機數對每一層的權值[W]初始化,以保證網絡不被大的加權輸入飽和;

(2) 計算網絡各層輸出矢量以及網絡誤差[E;]

(3) 計算各層反傳的誤差變化并計算各層權值的修正值以及新權值;

(4) 再次計算權值修正后誤差的平方和;

(5) 檢查誤差是否小于給定誤差,若是,訓練結束;否則繼續。

輸入信號[Xi]通過中間節點(隱藏層節點)作用于輸出節點,經過非線性變換,產生輸出信號[Yk,]網絡訓練的每個樣本包括輸入向量[X]和期望輸出量[t](類別),網絡輸出值[Y]和期望輸出值(真值)[t]之間的偏差,通過調整輸入節點與隱藏層節點的連接強度取值和隱藏層節點與輸出節點之間的連接強度以及閾值,使誤差沿梯度的方向下降,經過反復學習訓練,確定與最小誤差項對應的網絡參數(權值和閾值),訓練即告停止。學習樣本的數量和質量影響學習效果和學習速度。

為了訓練一個BP網絡,需要計算網絡加權輸入矢量以及網絡輸出和誤差矢量,然后求得誤差平方和。當所訓練矢量的誤差平方和小于誤差目標,訓練則停止;否則在輸出層計算誤差變化,且采用反向傳播學習規則調整權值,并重復此過程。當網絡完成訓練后,對網絡輸入一個不是訓練集合中的矢量,網絡將給出輸出結果。

2.3 回歸測試用例包選取

基于全量的測試用例庫,回歸測試包的選擇策略可遵循下述基本算法進行:

(1) 識別出軟件中被修改的部分。

(2) 從原基線測試用例庫[T]中,排除所有不再適用的測試用例,確定那些對新的軟件版本依然有效的測試用例,其結果是建立一個新的基線測試用例庫[T0。]

(3) 依據一定的策略從[T0]中選擇測試用例測試被修改的軟件。

(4) 如果必要,生成新的測試用例集[T1,]用于測試[T0]無法充分測試的軟件部分。

(5) 用[T1]執行修改后的軟件。

在上述步驟中,第(2)和第(3)步測試驗證修改是否破壞了現有的功能,第(4)和第(5)步測試驗證修改工作本身。第(3)步中,將神經網絡知識結合到測試領域,通過對樣本的學習,確認修改沒有引入新的錯誤或導致其他代碼產生錯誤。

其主要思想為:對于[q]個輸入學習樣本:[P1,P2,…,Pq,]已知與其對應的輸出樣本為:[T1,T2,…,Tq。]通過網絡的實際輸出[A1,A2,…,Aq]與目標矢量[T1,T2,…,Tq]之間的誤差來修改其權值,使[Al (l=1,2,…,q)]與期望的[Tl]盡可能地接近,使網絡輸出層的誤差平方和達到最小。

3 回歸測試實踐的優化

在項目測試過程中,不僅需要應用高新的測試技術,也要從宏觀上制定可行的測試策略,解決在有限的時間中使測試覆蓋率最優化。本文從項目實踐角度出發,提出以下的回歸測試策略:

(1) 對所有已修復Bug進行驗證;

(2) 對新增功能進行全量重點測試;

(3) 對原有功能,按優先級進行測試。基于一定的風險標準從基線測試用例庫中選擇回歸測試包。首先運行最重要、關鍵和可疑的測試,而跳過那些非關鍵、優先級別低或者高穩定的測試用例,這些用例即便可能測試到缺陷,這些缺陷的嚴重性也較低,不影響系統的功能。一般而言,測試從主要特征到次要特征。

(4) 對修復的Bug可能會引入新的Bug的功能模塊重點測試,可采用本文介紹的神經網絡進行樣本訓練和用例篩選。將回歸測試局限于被改變的模塊和它的接口上。通常,一個回歸錯誤一定涉及一個新的、修改的或刪除的代碼段。在允許的條件下,回歸測試盡可能覆蓋受到影響的部分。

(5) 如果情況允許,測試全部用例的策略是最安全的策略。但已經運行過許多次的回歸測試不太可能揭示新的錯誤,而且很多時候,由于時間、人員、設備和經費的原因,不允許選擇再測試全部用例的回歸測試策略,此時,可以選擇適當的策略進行縮減的回歸測試。

4 結 語

將神經網絡知識引入到測試領域是一個比較新的研究,本文就此方向進行了研究,并給出了實例說明。然而,BP神經網絡需要大量的樣本數據用來訓練和測試,當樣本數量不夠時,預測的誤偏差可能會較大,回歸測試開始時,由于數據樣本不足,可能會存在預測的偏差,所以下一步的研究方向將是如何克服這一問題。

參考文獻

[1] 廖劍鋒,蔡賢濤.組合測試中用例集的選擇策略[J].計算機工程與應用,2012,48(11):65?70.

[2] 鈕鑫濤,聶長海,CHAN Alvin.組合測試故障定位的關系樹模型[J].計算機學報,2014,37(12):2505?2518.

[3] 聶長海,徐寶文,史亮.一種基于組合測試的軟件故障診斷方法[J].東南大學學報:自然科學版,2003,33(6):681?684.

[4] 徐寶文,聶長海,史亮,等.一種基于組合測試的軟件故障調試方法[J].計算機學報,2006,29(1):132?138.

[5] YILMAZ C. Covering arrays for efficient fault characterization in complex configuration space [J]. IEEE Transaction on Software Engineering, 2006, 32(1): 20?34.

篇5

關鍵詞:BP神經網絡;飼料產量;飼料產量預測;畜牧水產業

中圖分類號:TP183 文獻標識碼:A 文章編號:2095-1302(2017)01-00-02

0 引 言

我國是世界上人口最多的國家,畜牧水產業的發展與我國國民生活息息相關。畜牧水產業的可持續發展需要飼料產業的支持。飼料產業為現代養殖業的可持續發展提供了重要的物質基礎,為我國人民生活水平的提高作出了重大貢獻[1]。

1979年,我國正式從傳統飼料進入現代飼料工業時代。經過30多年的發展,我國飼料產量逐年增加,于2011年開始超過美國,躍居世界第一,同時我國飼料從一開始飼料產品品種單一,質量不高,到現在飼料產品多樣化、系列化,且飼料產品質量管理體系不斷完善,有力地推動了養殖業的快速可持續發展,加快了農業結構調整,增加了國民收入[2]。

目前,國內用于飼料產量預測的方法并不多,范潤梅[3]提出的灰色預測理論建立了GM(1,1)模型用于預測20092011年我國飼料產量,該模型具有較好的預測精度。但由于灰色預測的理論缺陷,當數據波動較大時,GM(1,1)模型預測誤差較大,有時不能滿足預測需要。而BP神經網絡具有強大的學習能力,可以逼近任意復雜的非線性函數,信息利用率較高,在預測中得到了廣泛應用[4-6]。本文利用BP神經網絡模型和灰色預測模型對我國20102015年的飼料產量進行了預測,結果表明,BP模型具有很好的預測效果,預測最大誤差為5.79%,平均誤差為3.56%,而灰色預測模型預測的最大誤差為12.95%,平均誤差為7.24%。因此BP神經網絡模型能夠更好地用于飼料產量的預y,具有更高的工程應用價值。

1 灰色理論模型

GM(1,1)模型的基本原理如下:

根據灰色理論的原理,本文建立灰色預測模型的步驟如下所示:

①輸入樣本數據,根據公式(3)對樣本數據進行累加處理。

②根據公式(6)求得B和YN。

③根據公式(7)求得模型的累加預測值。

④根據公式(8)求得樣本的預測值。

灰色預測模型流程圖如圖1所示。

2 BP神經網絡模型

BP神經網絡有一個輸入層、一個輸出層和一個或多個隱含層,同層神經元間無關聯,異層神經元間向前連接。根據對象的復雜程度,選擇適當的網絡結構就可以實現從輸入空間到輸出空間的任意非線性函數的映射。BP神經網絡拓撲結構如圖2所示。

BP神經網絡建模流程圖如圖3所示。BP神經網絡模型的建立需要按照如下步驟進行:

(1)輸入樣本數據,對樣本數據進行歸一化處理。

(2)設置神經網絡的誤差精度、學習速率、最大訓練次數等參數。

(3)使用梯度下降法對權值和閾值進行調整,同時使用反向傳播算法對BP神經網絡進行訓練。

(4)訓練合格則模型建立成功,否則繼續訓練。

(5)使用訓練好的模型進行預測,輸出預測值。

(6)對預測值進行反歸一化處理,得到真實的預測值。

3 兩種模型在飼料產量預測中的應用

本文取19922015年這24年的飼料總產量相關數據進行飼料產量預測,以1992為起點依次選取19年的數據作為訓練樣本分別采用灰色預測模型和BP神經網絡模型來預測下一年的飼料產量,其預測結果和誤差分別如圖4、圖5所示。

從圖4可以看出,20112012年灰色模型和BP神經網絡模型的預測值與實際值都能夠較好地吻合,而2013年我國飼料產量下降,數據曲線不再線性增加,此時灰色模型的預測值就偏離了實際值,預測誤差增大,但是BP神經網絡模型的預測值還是可以與實際值較好地吻合。從圖5可以看出,BP神經網絡模型的誤差大約為5%,而灰色模型的誤差最大達到了10%以上。從圖4和圖5中可以看出,BP神經網絡模型相比灰色模型具有更高的預測精度,能夠更好地用于飼料產量預測。

4 結 語

由以上分析可知,采用灰色模型進行飼料產量預測時,當飼料產量減少,波動較大,灰色預測模型的預測誤差就可能會增大。本文采用BP神經網絡模型有效減小了波動時產生的預測誤差,提高了預測精度,為飼料產量的預測提供了一種新的研究方法。但該方法并不能夠時時優于灰色模型,因此該方法有待于進一步完善和發展。

參考文獻

[1]馬廣鵬.我國飼料行業發展現狀及趨勢分析[J].飼料工業,2013(4):45-47.

[2]徐倩.畜牧飼料行業信息化管理進程[J].廣東飼料,2015,24(8):10-13.

[3]范潤梅,解沛,王征南.灰色預測模型在我國飼料產量預測[J].中國畜牧雜志, 2009,45(8):13-16.

[4]王啟平.BP神經網絡在我國糧食產量預測中的應用[J].預測 2002,21(3):79-80.

[5]周彩蘭,劉敏.BP神經網絡在石油產量預測中的應用[J].武漢理工大學學報,2009(3):125-129.

[6]徐黎明,王清,陳劍平,等.基于BP神經網絡的泥石流平均流速預測[J].吉林大學學報(地球科學版),2013,43(1):186-191.

篇6

引言

分子蒸餾是一種新型的在高真空條件下進行的液-液分離技術,具有蒸餾溫度低(低于物質沸點溫度)真空度高,物料受熱時間短,分離程度高等特點;且分離過程不可逆,沒有沸騰鼓泡現象[1]。特別適用于分離高沸點、熱敏性、高粘度和易被氧化的物質。但是分子蒸餾過程是一個極其復雜的過程,實際生產中除了發揮其優點外,還要要兼顧生產效率及產品質量,因此,分子蒸餾生產工程的工藝參數優化是一個多目標組合優化問題[2]。生產中根據生產目標選擇相應的工藝指標,這就需要進行反復實驗來獲取目標下的最佳工藝參數值。由于分子蒸餾過程的復雜性,導致其工藝參數比較多,難以用數學方法來解決。而人工神經網絡具有人體腦神經系統的信息處理機制,可以映射任何較為復雜的非線性關系,具有自學習能力。本文采用應用較為廣泛的BP神經網絡和遺傳算法相結合,將其運用到分子蒸餾過程中的工業參數優化中,通過給定分子蒸餾的工藝參數及生產指標,經過大量樣本的學習訓練使網絡達到允許的誤差范圍,映射工藝參數與生產指標之間的復雜非線性關系[3-4]。以該模型的預測性能輸出作為目標函數,對工藝參數進一步優化,從而實現預定的工藝指標下的分子蒸餾工藝參數的優化。

1分子蒸餾參數測試實驗

1.1分子蒸餾過程模型氣體分子從液體表面溢出,由于其自由程的不同,與其他分子碰撞前的飛行距離各不相同。分子蒸餾技術就是利用不同種類分子逸出液面后平均自由程不同的性質實現分離的。Langmuir[5]根據理想氣體的動力學理論提出了分子自由程的數學模型:式中,p為分子所處環境壓強;λm為分子運動平均自由程;d為分子有效直徑;T為分子所處環境溫度;k為玻爾茲曼常數。由式(1)分子平均自由程公式可知,氣體分子平均自由程與溫度成正比,與壓強反比。當加熱板上的物料達到一定溫度時,分子平均自由程大于板間距離的輕組分脫離加熱板飛向冷凝板,在冷凝板上捕獲,而平均自由程小于板間距的重組分到達不了冷凝板,從而實現了物質的分離。其分離過程如圖1所示。

1.2實驗設備本文在DCH-300三級分子蒸餾裝置的基礎上進行參數測試實驗研究。實驗裝置的刮膜式短程蒸發器分子蒸餾過程為:液料放入原料罐被計量泵抽取。泵用穩定流量輸送物料,經過管道被送入降膜器內的旋轉分配器,在離心力的作用下,被甩向夾套加熱室內壁,這時物料液體受重力的作用,沿著內壁向下流動,與此同時裝在轉軸上的刮板,把料液刮成簿膜,這樣料液受加熱而蒸發,由于在重力及離心力的作用下,不斷地更新液膜。根據分子運動理論知道,液體混合物的分子受熱后運動會加劇,當接受到足夠的能量時,輕組分首先就會從液面溢出而成為氣體分子,當氣體分子逸出碰到內冷凝列管時,瞬即從氣體變為液體并被柱下氣相罐收集,重組分因達不到逸出溫度,而仍然以液體狀態流出蒸餾柱,由液相罐收集。圖2為蒸餾裝置的工藝原理圖,其中,H1、H2、H3為三級的蒸發器,蒸發器面積分別為0.02m2,0.26m2,1.1m2。L1、L2、L3為三級的冷凝器,并且每一級的蒸發器都配有各自的刮膜電機,可以控制刮膜轉速,提高蒸發速率,每一級的冷凝系統都與冷機相連,保證具有合適的冷凝溫度。第二級包括一個水環真空泵、2個羅茨真空泵,1個增壓真空泵構成的泵組,第三級包括旋片真空泵和增壓泵,三級真空度越來越高,蒸餾的溫度就可以逐級降低,達到負壓低溫蒸發的降低能耗的目的。

1.3實驗方案及結果本實驗采用了3次蒸餾,第一級蒸餾為預脫氣、脫水處理階段,即薄膜蒸發階段,為確保后續蒸餾時具有足夠高的真空,而除去物料的空氣和溶劑等組份。物料進蒸餾器之前,經一級除氣裝置進行脫氣處理,然后以一定的速率進入二級、三級分子蒸餾刮膜器中,在高真空和適宜的蒸餾溫度下進行,分離出殘余物和餾出物。實驗安排采用在改變一個因素的單因素實驗設計下,固定其他參數,對得到的實驗結果進行比較,以便對這一因素的影響作出結論。實驗水平如表1所示。本次實驗共采用9組進行試驗,通過改變蒸餾溫度、進料速率和真空度等參數,對實驗所得精油含量與得率的影響。實驗結果如表2所示通過上述試驗結果可以看出,并不是工藝參數(即蒸餾溫度、進料速率和真空度的值)越大越好,且沒有規律可循。也有采用正交試驗進行工藝參數優化的方法,但對于分子蒸餾采取該種方法不可行,因為正交實驗法是當真空度不變時,通過多次實驗得到最佳溫度,在此溫度下再通過多次蒸餾實驗摸索最佳真空度,而分子蒸餾的蒸發器的溫度與真空度是具有耦合關系的量,當真空度改變,物質的沸點發生改變,即真空度變化,最佳蒸餾溫度隨之改變,因此為了提高生產效率及產品指標,進行高效、高質地分離提取,本文采用了基于BP網絡和遺傳算法的分子蒸餾工藝參數優化方法。

2BP神經網絡及遺傳算法優化模型的建立

2.1基本原理人工神經網絡信息處理、魯棒性、自學習及非映射能力較強,遺傳算法具有并行、隨機和自適應搜索等優點[6]。本文采用神經網絡與遺傳算法相結合的優化設計方法,充分利用二者優點。基本原理是:首先通過試驗獲得目標函數與工藝參數之間的離散試驗數據關系。將試驗數據作為網絡的樣本,對網絡進行訓練,當網絡達到誤差要求時,存儲權值閾值,利用網絡的記憶功能,建立起工藝參數與指標之間的非線性映射關系。再利用遺傳算法對這一黑匣型的函數求解。上述優化問題的數學表達形式為:其中,xi表示神經網絡的輸入,yi表示神經網絡的輸出,f是評價函數。算法的實現過程為:運用試驗獲得的大量樣本對網絡進行訓練,建立穩定的BP網絡預測模型,對訓練好的模型在一定范圍內隨機產生多組輸入向量,通過BP預測出相應的輸出量,再通過評價函數,計算個體適應度值,再利用遺傳算子通過適應度值調整輸入向量,產生具有更好適應性的新的種群。通過遺傳算子的計算得到優化目標,相應輸入即為目標的優化結果。

2.2BP神經網絡預測模型BP神經網絡是目前應用最廣、最為成熟的1種采用誤差反向傳播的前饋型多層神經網絡。包括輸入層、中間層和輸出層。選取1組訓練樣本提供給神經網絡,經過隱含層激活函數后向輸出層傳播,隱含層的輸出作為輸出層的輸入,最后獲得網絡的輸入響應。接下來進行的誤差的反向傳播階段,即按照網絡輸出與目標值之間的誤差減小方向傳播,從輸出層到隱含層再到輸入層,逐層修正各層之間的連接權值[7-8]。含有一個隱層的3層BP神經網絡可以任意精度逼近任何有理函數。本文采用單隱含層的BP神經網絡作為預測模型,其模型結構如圖3所示。大量學習樣本對BP神經網絡進行訓練后,分子蒸餾工藝參數與產品指標之間就會通過神經網絡建立起1種能映射二者之間內在關系的連接關系,即獲得產品指標預測的BP神經網絡模型。本文在Matlab7.0神經網絡工具箱的基礎上[8-9],安排了18組試驗樣本,選擇9組作為訓練樣本,其余9組作為測試樣本,網絡結構為3×6×2,輸入層節點為3,分別為蒸餾溫度,真空度及進料速率;隱層節點為6,輸出層為2,分別為產品的含量和得率。數據歸一化處理,訓練時,不同的訓練函數的訓練速度和精度不同,這里采用梯度下降法,訓練誤差曲線如圖4所示。經過42次的網絡訓練,網絡的訓練誤差值就收斂到預定的目標誤差0.001。訓練后的神經網絡用于產品指標預測,由預測結果與試驗結果進行比較可知,訓練后的神經網絡具有較高的預測精度。

2.3優化模型的建立遺傳算法是1種通過模擬自然進化過程,根據自然選擇和遺傳算法,進行隨機、自適應搜索最優解的方法。遺傳算法將自然界適者生存、劣者淘汰的生物進化原理引入到待優化參數問題中,將待優化變量進行編碼,組成初始種群,將其按一定的適應度函數及遺傳算子的操作,即選擇、交叉和變異,選擇適應度值較大的個體,形成高適應值的新群體,經過反復進行,最終找到適應度最大的個體[10],此時的個體即為優化結果。本文以遺傳算法作為蒸餾工藝參數的優化方法。式中,W1和W2分別為工藝權值,T1,T2分別為含量與得率的目標值。可見目標函數越小預測值越接近目標值,當目標函數最小時對應的工藝參數值為最優值。遺傳算法在進化搜索中基本不利用外部信息,僅以適應度函數為依據,個體的適應度越大,表明其適應能力越強[12-15]。建立的目標函數需符合適應度函數要求,本文采用的適應度函數就是目標函數的倒數。工藝參數優化流程如圖5所示。經過遺傳算子作用后的工藝參數作為神經網絡的輸入,通過訓練好的神經網絡模型輸出目標函數值,再計算個體適應度函數值,再進行選擇,交叉概率為0.8,變異概率為0.01等遺傳操作獲得新一代種群。通過反復進化計算,直至適應度函數值趨于穩定,此時的輸入值為最優解,優化結果如圖6所示。此時W1=W2=0.5,達到穩定后的適應度值為38.97。此時蒸餾溫度為120℃,進料速率295r/min,進料速率60L/h。

篇7

Abstract: In order to improve the busy airport emergency management ability, and provide scientific basis for the busy airport emergency plan, a new method based on the combination of grey model and improved support vector regression model is proposed. Time series prediction is done to the abnormal peak traffic on the busy airport flights small sample.

關鍵詞: 灰色模型;支持向量回歸機模型;高峰航班流量;小樣本;時間序列預測

Key words: grey model;support vector regression model;peak flight flow;small sample;time series prediction

中圖分類號:V355;F224 文獻標識碼:A 文章編號:1006-4311(2014)11-0316-02

0 引言

隨著我國民航事業的迅猛發展,空中交通流量驟然增加,航班流量是民航空中交通管制的重要數據,是評定民航空管發展水平的關鍵指標。對非常態的高峰航班流量進行預測,不僅有助于提高繁忙機場的應急管理能力,而且還能為繁忙機場制定應急預案提供科學依據。但是因為繁忙機場的非常態高峰航班流量受到諸多因素的影響作用,系統的發展變化并非是線性的,而是高度非線性的,所以就很難直接的發現描述系統發展變化規律的函數。

目前采用最多的是灰色預測方法或支持向量回歸機方法(SVR)。文獻[1]采用灰色預測對航班流量進行預測,灰色預測方法在解決繁忙機場非常態高峰航班流量這種“部分因素已知,部分因素未知”的“小樣本”、“貧信息”的時間序列預測中是一種非常有效的方法,先對原始數據進行生成處理,淡化或消除沖擊擾動對系統行為數據序列的影響,然后利用生成數據序列建立預測模型,但是灰色模型預測的精度并不高。文獻[4]采用SVR模型對航班流量進行預測,SVR是基于統計學習理論框架下的一種新的通用機器學習方法。它首先較好地解決了以往困擾很多學習方法的小樣本、過學習、高維數、局部最小等實際問題,其次具有很強的泛化能力,是解決小樣本時間序列預測建模的又一種可行的有效途徑。將灰色模型與SVR模型兩者相結合――灰色支持向量回歸機模型,利用灰色預測方法中“累加生成”的優點,削弱原始數據序列中隨機擾動因素的影響,使雜亂無章的原始數據中所隱藏的規律顯露出來,使數據更具有規律性,得到便于SVR學習的新序列,進而建立優于單一SVR方法的預測模型。

1 GM(1,1)預測模型

令原始數列x(0)=(x(0)(1),x(0)(2),…,x(0)(n))為非負,用累加生成法對原始數列進行一次累加生成x(0)的1-AGO序列為:

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中x(1)(k)=■x(0)(i),(k=1,2,…n)。GM(1,1)的灰微分方程模型為

x(0)(k)+az(1)(k)=b(k=2,3,…,n)(1)

其中,GM表示Gray Model(即灰色模型),方程的階數和變量均為1,x(0)(k)為灰導數,a為發展系數,b為灰作用量,z(1)(k)為白化背景值。相應的白化微分方程為

■+ax■=b(2)

記u=(a,b)T,Y=(x(0)(2),x(0)(3),…,x(0)(n))T,B=-Z■(2) 1-Z■(3) 1 ┆ ┆-Z■(n) 1

按最小二乘法得出灰參數■=(a,b)■=(B■B)B■B■Y。

GM(1,1)的灰微分方程的解為

■(k+1)=(x(1)(0)-■)e-ak+■(3)

將其累減還原得到非負原始序列x(0)的預測值為

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)(4)

2 改進的SVR預測模型[3-5]

2.1 SVR原理 假定在航班流量預測問題中,待擬合樣本數據集為(x1,y1),(x2,y2),…,(xn,yn)其中n為樣本集容量。SVR在處理非線性問題時先用非線性映射?準(?)將樣本數據x映射到高維特征空間H中去,并在這個空間中對函數f(x)=w??準(x)+b做線性回歸處理。根據SVR結構風險最小化原理,函數f(x)應使如下風險函數最小

R(w)=■w2+C■L(f(x■)-y■)(5)

式中w為回歸系數向量,C為一大于零常數稱為懲罰系數,控制對超過不敏感值誤差的樣本數據的懲罰程度,

L(f(x■)-y)為損失函數,依據航班流量預測的特點,這里筆者選取ε不敏感損失函數為式(7)。

L(f(x■)-y)=0,f(x■)-y■

ε為不敏感值,控制著模型精度。

由于要考慮允許擬合誤差,引入松弛因子ξ和ξ*。于是航班流量回歸估計問題就轉化為在約束條件(8)下的最小化函數(7)的問題。R(w,ξi,ξ■■)=■w2+C■(ξi+ξ■■)(7)

s.t.f(x■)-yi?燮ξ■■+εy■-f(x■)?燮ξi+εξi,ξ■■?叟0i=1,2,…,n(8)

先對式(8)采用拉格朗日乘子處理,然后按照對偶原理將式(8)轉化為下面的凸二次規劃問題w(α,α*)=■(αi-α■■)yi-■(αi-α■■)ε-■■(αi-α■■)(αj-α■■)?準(xi)??準(xj)(9)

s.t.■(αi-α■■)=00?燮αi,α■■?燮C(10)

這里α,α*是拉格朗日乘子,可以由式(9)求出,αi或α■■不等于零的項所對應的樣本數據就被稱為支持向量,此時擬合函數就變成f(x)=■(αi-α■■)k(xi?x)+b(11)

這里k(xi?x)=?準(xi)??準(x)稱為核函數,能夠滿足Mercer條件,xi為支持向量,x為待預測數據。

2.2 參數優化 SVR模型參數有懲罰因子C,所選用核函數的參數γ和ε不敏感值,恰當的參數組合可以提高回歸模型的泛化性能。主要的參數選擇算法有留一法、交叉驗證法、試湊法、網格搜索法、梯度下降法和免疫算法等。本文采用網格搜索法和計算精度較高的交叉檢驗法確定參數。

3 灰色支持向量回歸機預測模型

繁忙機場航班流量受諸多因素影響,有的因素數據不易測量,有的則尚未可知,所以本文利用灰色模型和支持向量回歸機的優點,建立灰色支持向量回歸機模型。

建模主要步驟如下:

步驟一:利用GM(1,1)預測方法得到非負原始序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),x(0)(i)>0,i=1,2,…,n的1-AGO序列

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),x(1)(k)=■x(0)(i),k=1,2,…,n。

步驟二:核函數K(xi,x)及參數的選取。

步驟三:利用SVR方法,求出優化問題的最優解,找出支持向量。

步驟四:構造出回歸決策函數f(x)。

步驟五:將1-AGO序列x(1)的預測值■求出。

步驟六:累減還原,得出預測模型,

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)。

4 繁忙機場非常態高峰航班流量預測

4.1 選擇最優參數 使用灰色支持向量回歸機方法預測機場航班流量,首先確定懲罰因子C,ε不敏感值和核函數,以及所選取的核函數的參數。文獻[5]研究表明:非線性輸入值不能作為線形核函數的輸入;出于對訓練性能的綜合考慮,經過比較,這里的輸入核函數采用在處理時間序列問題時表現比其他核函數更佳的徑向基核函數

k(xi,x)=exp(-γxi-x2)(12)

采用網格搜索法和計算精度較高的K-CV方法確定參數,基本原理是讓C和γ在一定的范圍劃分網格并遍歷網格內所有點進行取值,對于取定的C和γ利用K-CV方法得到在此組C和下γ訓練集驗證分類準確率,最終取使得訓練集驗證分類準確率最高的那組C和γ作為最佳的參數。

4.2 仿真實驗及結果分析 以首都國際機場2009年~2013年春節期間航班流量數據中的旅客流量為例,對灰色支持向量機預測方法的實際預測效果進行驗證。由于春節前后近6周都處于航班旅客流量高峰期,所以有必要對春節前后共6周每周的平均每天航班旅客流量進行預測。

以2009年~2010年的首都國際機場旅客流量數據即編號前24個作為學習樣本(其中a~f表示春節月中第一周到第六周)。然后以2013年春節期間6周的平均每周的航班流量數據即編號后6個作為測試樣本,進行仿真實驗,同時,為了便于比較本文方法的有效性,還利用GM(1,1)模型和單一的SVR模型對原始數據進行預測。將3種模型的預測結果做出對比,取得的仿真實驗結果。

從圖1可以看出離原始數據最近的是灰色支持向量回歸機預測數據,由此可知利用灰色支持向量回歸機模型預測的結果精度比GM(1,1)模型和單一的SVR方法預測精度更高,結果較為準確可靠。由仿真實驗結果能夠得出灰色支持向量回歸機模型在為繁忙機場航班流量預測方面優于GM(1,1)模型和單一SVR模型。因此,用灰色支持向量回歸機模型對首都國際機場2016年的春節期間的航班流量進行預測,預測結果見表1。

5 結束語

灰色支持向量回歸機模型發揮了中“累加生成”的優點,削弱了原始數據中的隨機性,增強了規律性,同時避免了GM(1,1)模型存在的理論缺陷,盡管組合模型中有個別數據擬合誤差偏大,但從整體預測效果看,仍然優于單一GM(1,1)模型或SVR模型。由于繁忙機場航班流量的產生受多種因素影響,包括當年年度國民經濟增長水平、票價浮動等諸多因素,因此,下一步要做的是,預測繁忙機場非常態高峰航班流量時,不應僅僅考慮時間因素,也應綜合考慮各種因素,以建立更準確地預測模型,為繁忙機場的應急管理提供更好的參考。

參考文獻:

[1]李旭.昆明空域航班流量預測[J].中國民航大學學報,

2012,30(5):5-8.

[2]國棟,張競博,何圣關.基于支持向量機的互連導線串擾分析及預測[J].科學技術與工程,2013,13(7):1816-1820.

[3]張衛華,孫浩,穆朝絮.基于支持向量機的交通安全預測模型及仿真研究[J].系統仿真學報,2009,21(19):6266-6270.

篇8

論文關鍵詞:BP神經網絡;電力企業;信息化水平;評價;指標體系

0引言

電力行業是國內應用信息技術較早的行業之一,先后經歷了生產過程自動化、管理信息化等建設階段。目前,電力信息化呈現出基礎設施齊備、數據龐雜、應用廣泛等特點,已從量化范疇提升到質的高度。對電力企業進行有效的信息化評價和管理,是提升信息化水平和實現企業信息化可持續發展的重要保障。

如何積極開展信息化建設來降低運營成本?通過何種指標來科學評價我國電力企業的信息化發展水平?這是當前電力行業必須解決的一個問題,而目前我國還沒有一套完整的電力企業信息化水平評價指標體系正式。通過構建科學、實用、有效的電力企業信息化水平評價體系,采用具有學習、記憶、歸納、容錯及自學習、自適應能力的BP神經網絡算法,科學、有效、客觀地評價電力企業信息化水平,有利于規范和完善電力企業信息化建設,促進電力信息化健康,快速地發展。

1電力企業信息化水平評價指標體系的建立

1.1建立的原則

(1)簡明科學原則。評價指標體系應明確反映電力企業信息化水平高低與指標間的關系,避免無關的指標列入,指標體系的大小也應適宜。若評價指標體系過大、指標層次過多、指標過細,則勢必將評價者的注意力吸引到細小問題上;而若評價指標體系過小、指標層次過少、指標過粗,則不能充分反映和評價電力企業信息化的整體設計與使用情況。

(2)公正合理原則。即評價指標應能客觀、公正、合理地體現電力企業信息化水平的動態性。

(3)易于操作原則。評價指標體系在實際應用中應具有可操作性,指標含義明確、可靠,數據易于收集,可供不了解指標體系建立過程的人員進行操作與應用。

(4)以定量指標為主,輔以一定的定性指標。評價指標盡可能以定量指標為主,但全部采用定量指標也不能完全反映電力企業信息化水平的整體情況,所以要輔以一些描述性的定性指標。

1.2指標體系的內容

結合電力企業信息化水平評價指標體系建立的原則,從3個層次來構建電力企業信息化水平評價指標體系,主要由業務支持程度、IT績效水平、信息技術水平、IT管理能力、IT持續發展能力等五大方面構成,如表l所示。

1.3指標值的確定及歸一化處理

在上述55個三級指標中,有定性指標和定量指標之分。根據指標的評價準則又可分為3類指標:正向指標、負向指標和優化指標。由于不同的指標從不同側面反映電力企業信息化水平,指標之間又由于量綱不同,所以無法進行比較。因此,為了便于最終評價值的確定,需要對各指標進行無量綱化處理,即對評價指標做標準化、正規化處理,以便消除指標量綱的影響。考慮神經網絡訓練的收斂問題,對所有指標分3種情況進行無量綱化處理。

(1)定性指標。定性指標有工程建設情況、信息安全措施、信息安全制度的完善程度、信息安全制度的執行情況、企業職工IT素質等。這些指標的評價值采用專家打分的辦法進行評價,取值為0.0~1.0之間。

(2)正向定量指標。是指標值越大越好的指標,包括:設備的運行率、安全運行時間、物資供應保障率、勞動生產率、網絡覆蓋率、聯通率等。因這類指標越大越好,故選用所有電力企業的最大值為該指標的理想值,進行無量綱化處理。

(3)負向定量指標。是指其值越小越好的指標,包括采購成本、生產成本、平均響應時間等。這類指標是越小越好,因此,選取所有電力企業的最小值為該指標的理想值,并進行無量綱化處理。

(4)優化指標。是指標具有一個最優的取值范圍,太大或太小都不好的指標,包括電力企業資產負債率指標,該指標如果太大說明企業在信息化投資建設中將會出現資不抵債的情況,不利于電力企業的發展;如果該指標值很小則說明在企業信息化建設中沒有發揮有限資本的價值。一般該指標取40%~60%比較理想,然后進行無量綱化處理。無量綱化處理方法如下:

(1)有量綱向無量綱的轉化。采取一種二次拋物偏大型分布的數學模型描述:

(2)無量綱指標的處理。采取線性遞增函數進行描述:

2電力企業信息化水平評價的神經網絡專家系統

2.1 BP神經網絡的基本原理

人工神經網絡(ANN)是由大量簡單的處理單元組成的非線性、自適應、自組織系統,它是在現代神經科學研究成果的基礎上,試圖通過模擬人類神經系統對信息進行加工、記憶和處理的方式,設計出的一種具有人腦風格的信息處理系統。它可廣泛應用于預測、分類、模式識別和過程控制等各種數據處理場合,相對于傳統的數據分析處理方法,更適合處理模糊、非線性和模式特征不明確的問題。

BP神經網絡是單向傳播的多層前向神經網絡,網絡可分為輸入層、中間層(隱含層)和輸出層,其中輸入和輸出都只有1層,中間層可有1層或多層。同層的網絡結點之間沒有連接,每個網絡結點表示一個神經元,其傳遞函數通常采用Sigmoid型函數。每對神經元之間的連接上有一個加權系數W,它可以加強或減弱上一個神經元的輸出對下一個神經元的刺激。這個加權系數通常稱為權值,修改權值的規則稱為權值算法。建立在BP神經網絡基礎上的專家系統根據一定的算法,通過對樣本數據的學習確定網絡權值。神經網絡專家系統的權值確定、結構穩定后,就可以處理新的數據,給出相應的輸出。

2.2基于BP網絡的電力企業信息化水平評價的學習過程

BP神經網絡電力企業信息化水平評價模型中,輸入層包含55個神經元,分別接受55個電力企業信息化水平評價中三級指標的樣本數據輸入;中間層包含26個神經元;輸出層有1個神經元,就是電力企業信息化水平評價結果,相應的BP網絡結構如圖1所示。

由于神經網絡各層的初始連接權值是任意的,必須先對神經網絡進行訓練,使電力企業信息化水平評價結果的實際輸出與期望值的偏差盡可能小。BP神經網絡通過訓練將學習樣本的真實值與網絡輸出的誤差反向傳播到各層的神經元,采用梯度下降法不斷調節各層的權值,減小因權值帶來的偏差,從而使訓練樣本真實輸出與網絡輸出的誤差控制在設定的0.001誤差范圍內。具體BP神經網絡學習過程如下:

(1)根據電力企業信息化水平評價指標要求,提供訓練集。選人對網絡輸出即電力企業信息化水平有影響的三級指標x1,x2,……,x55作為輸入自變量,以此確定輸入節點的個數(本網絡有55個輸入節點);

(2)進行初始化。置所有權值為隨機任意小,給定學習精度£一10,目標誤差為0.001,讀入網絡初始權重及學習樣本。這里可通過對電力企業300名職工開展問卷調查,隨機抽取前100組記錄(樣本序號為1~100)作為神經網絡辯識模型的訓練樣本;

(3)按BP算法訓練網絡。學習過程流程如圖2所示;

(4)判斷學習精度是否達到要求,如達到轉入下一步執行;否則返回上一步繼續學習;

(5)儲存并輸出權值。利用訓練好的網絡進行測試(采用10個樣本記錄為例),輸出電力企業信息化水平的最終評價結果。

3實驗結果及分析

采用BP神經網絡對電力企業信息化水平進行辨識,輸入層、隱含層和輸出層的結點數分別為55×26×1。根據經驗和試驗,前100組記錄用作學習樣本,作為訓練神經元連接權值用,學習精度£=1×10;后10組(樣本序號為291~300)樣本作為測試檢驗用。經過反復多次學習,其學習結果(測試)如表2所示。