新建風(fēng)電場(chǎng)短期風(fēng)電預(yù)測(cè)方法

時(shí)間:2022-09-30 10:00:29

導(dǎo)語(yǔ):新建風(fēng)電場(chǎng)短期風(fēng)電預(yù)測(cè)方法一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

新建風(fēng)電場(chǎng)短期風(fēng)電預(yù)測(cè)方法

長(zhǎng)久以來(lái),人類(lèi)社會(huì)以化石燃料作為主要能源。化石能源長(zhǎng)期地開(kāi)采使用,也帶來(lái)了資源枯竭、大氣污染和氣候變暖等一系列問(wèn)題。風(fēng)能作為傳統(tǒng)化石能源的一種替代能源,具有分布地域廣、儲(chǔ)量豐富和可再生等特點(diǎn),在滿(mǎn)足人們對(duì)能源需求的同時(shí),也能實(shí)現(xiàn)人類(lèi)社會(huì)的可持續(xù)性發(fā)展。但風(fēng)力發(fā)電具有和傳統(tǒng)發(fā)電方式不同的特點(diǎn),例如風(fēng)能具有季節(jié)性、間接性、隨機(jī)波動(dòng)等,這都決定了風(fēng)力發(fā)電相關(guān)技術(shù)更加復(fù)雜。其中對(duì)風(fēng)電功率的預(yù)測(cè),直接影響到風(fēng)電并網(wǎng)安全性和電力市場(chǎng)競(jìng)爭(zhēng)力。風(fēng)電功率的準(zhǔn)確預(yù)測(cè)對(duì)風(fēng)力發(fā)電企業(yè)非常重要,是電力調(diào)度中的重點(diǎn)、難點(diǎn)問(wèn)題,也是研究當(dāng)中的熱點(diǎn)問(wèn)題。風(fēng)電功率預(yù)測(cè)可以按時(shí)間尺度、空間尺度、預(yù)測(cè)形式等多個(gè)角度進(jìn)行分類(lèi),按照不同的預(yù)測(cè)模型主要可分為物理模型、統(tǒng)計(jì)模型和人工智能方法三類(lèi)。物理模型方法通過(guò)將風(fēng)力、風(fēng)向角以及電機(jī)可調(diào)參數(shù)等影響因素,抽象為相應(yīng)的數(shù)學(xué)模型,在風(fēng)場(chǎng)中通過(guò)傳感器實(shí)時(shí)監(jiān)控相關(guān)參數(shù),實(shí)現(xiàn)電機(jī)功率的實(shí)時(shí)預(yù)測(cè)。統(tǒng)計(jì)模型方法利用統(tǒng)計(jì)學(xué)知識(shí),將歷史采集數(shù)據(jù)進(jìn)行識(shí)別、擬合和趨勢(shì)分析,最終對(duì)風(fēng)電功率做出預(yù)測(cè)。人工智能方法則是以數(shù)據(jù)為驅(qū)動(dòng),通過(guò)深度神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的學(xué)習(xí),提取數(shù)據(jù)內(nèi)部的關(guān)聯(lián)性和高維特征,并據(jù)此對(duì)風(fēng)電功率短期情況給出預(yù)測(cè)結(jié)果。風(fēng)電功率預(yù)測(cè)本質(zhì)上是建立風(fēng)廠內(nèi)各因素的相互關(guān)系,其預(yù)測(cè)精準(zhǔn)度必須建立在足夠多的歷史數(shù)據(jù)上。而新建風(fēng)電場(chǎng)往往缺少風(fēng)場(chǎng)內(nèi)相關(guān)信息,難以為風(fēng)電功率的預(yù)測(cè)提供支撐。

基于對(duì)抗神經(jīng)網(wǎng)絡(luò)的風(fēng)電數(shù)據(jù)生成數(shù)據(jù)清洗

由于風(fēng)電本身的不穩(wěn)定性,以及非預(yù)計(jì)停機(jī)、棄風(fēng)限電、天氣異常等原因,風(fēng)場(chǎng)采集的數(shù)據(jù)中往往會(huì)存在大量的異常點(diǎn),這些異常點(diǎn)將對(duì)正常情況下的風(fēng)電功率預(yù)測(cè)產(chǎn)生影響。本文用變點(diǎn)分組法原理、最小二乘法原理和四分位法來(lái)處理原始數(shù)據(jù),從而實(shí)現(xiàn)異常點(diǎn)的剔除,另外使用臨近值補(bǔ)全的方法對(duì)缺失值進(jìn)行一個(gè)填補(bǔ)。這樣處理得到的數(shù)據(jù)更有利于風(fēng)電功率的預(yù)測(cè)。

風(fēng)電數(shù)據(jù)生成

生成對(duì)抗網(wǎng)絡(luò)屬于非監(jiān)督式學(xué)習(xí)方法,是深度學(xué)習(xí)領(lǐng)域的一個(gè)重要生成模型。其內(nèi)部主要包含生成器和判別器兩個(gè)網(wǎng)絡(luò),生成器神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)利用已有數(shù)據(jù)樣本生成新的樣本,而判別器神經(jīng)網(wǎng)絡(luò)則負(fù)責(zé)將生成樣本從真實(shí)樣本中盡可能分辨出來(lái)。兩個(gè)網(wǎng)絡(luò)相互對(duì)抗、不斷調(diào)整參數(shù),最終目的是使判別網(wǎng)絡(luò)無(wú)法判斷生成網(wǎng)絡(luò)的輸出樣本是否真實(shí)。因?yàn)橛行╋L(fēng)電場(chǎng)歷史數(shù)據(jù)量較小,可以利用生成器網(wǎng)絡(luò)產(chǎn)生的樣本,進(jìn)行數(shù)據(jù)樣本的擴(kuò)充。并且對(duì)抗神經(jīng)網(wǎng)絡(luò)是基于非監(jiān)督式學(xué)習(xí),所以不需要準(zhǔn)備非常多的數(shù)據(jù)。利用風(fēng)電場(chǎng)已有的風(fēng)電數(shù)據(jù)來(lái)訓(xùn)練對(duì)抗生成網(wǎng)絡(luò),其中的生成模型網(wǎng)絡(luò)可以模擬真實(shí)數(shù)據(jù)的概率分布,并輸出合成樣本。而判別網(wǎng)絡(luò)需要學(xué)習(xí)區(qū)分這個(gè)生成的風(fēng)電數(shù)據(jù)是否來(lái)自真實(shí)的數(shù)據(jù)分布,經(jīng)過(guò)多輪不斷地對(duì)抗,從而使合成數(shù)據(jù)也能夠達(dá)到真實(shí)數(shù)據(jù)的效果。用于合成風(fēng)電數(shù)據(jù)的對(duì)抗生成網(wǎng)絡(luò)框架設(shè)計(jì)如圖1所示。在GAN神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)使用到的對(duì)抗損失函數(shù)可以下式來(lái)表示。行業(yè)曲線開(kāi)放度創(chuàng)新度生態(tài)度互交度持續(xù)度可替代度影響力可實(shí)現(xiàn)度行業(yè)關(guān)聯(lián)度真實(shí)度楊乘勝,男,碩士,安徽蕪湖,高級(jí)工程師,南京華盾電力信息安全測(cè)評(píng)有限公司,研究方向:電力系統(tǒng)及其自動(dòng)化。在式(1)中,z代表隨機(jī)變量,pz(z)代表z的數(shù)據(jù)分布,Pdata(x)代表真實(shí)樣本的分布,D和G分別代表判別器和生成器,minGmaxDV(D,G)在于最大化判別器D的價(jià)值函數(shù)而最小化生成器G的價(jià)值函數(shù)。在GAN神經(jīng)網(wǎng)絡(luò)整個(gè)訓(xùn)練過(guò)程中,一個(gè)隨機(jī)變量會(huì)輸入生成器G并輸出合成數(shù)據(jù),之后由判斷器D確定它是否為真數(shù)據(jù)。整個(gè)訓(xùn)練過(guò)程需要最大化判別器的概率logD(x),即讓所有的數(shù)據(jù)都被認(rèn)為來(lái)自真實(shí)的數(shù)據(jù)集,相對(duì)的要最小化生成器的概率log(1-D(G(z))),使得合成數(shù)據(jù)愈加接近真實(shí)數(shù)據(jù)的分布。網(wǎng)絡(luò)采取的是向后傳播的方式來(lái)調(diào)整內(nèi)部參數(shù),使得網(wǎng)絡(luò)能夠結(jié)合預(yù)測(cè)值和真實(shí)值之間的誤差,學(xué)習(xí)到風(fēng)電數(shù)據(jù)的高維特征。

基于遺傳算法的風(fēng)電預(yù)測(cè)

遺傳算法的理論基礎(chǔ)是達(dá)爾文的進(jìn)化論,它通過(guò)模擬自然界中競(jìng)爭(zhēng)的方式產(chǎn)生優(yōu)勝劣汰的分化。在使用遺傳算法時(shí),將潛在的解集設(shè)定為初始的種群,并通過(guò)遺傳算法的自然選擇原理進(jìn)行不斷地進(jìn)化,最終得出一個(gè)最優(yōu)個(gè)體作為整體的一個(gè)最優(yōu)解。遺傳算法的構(gòu)造過(guò)程可以按照以下方式進(jìn)行:(1)確定決策變量及其各種約束條件,即確定出個(gè)體的表現(xiàn)型X和問(wèn)題的解空間。(2)建立優(yōu)化模型,即確定出目標(biāo)函數(shù)的類(lèi)型及其數(shù)學(xué)描述形式或量化方法。(3)確定個(gè)體適應(yīng)度的量化評(píng)價(jià)方法,即確定出由目標(biāo)函數(shù)值f(X)到個(gè)體適應(yīng)度F(X)的轉(zhuǎn)換規(guī)則。(4)設(shè)計(jì)遺傳算子,即確定出選擇運(yùn)算、交叉運(yùn)算、變異運(yùn)算等遺傳算子的具體操作方法。(5)選擇運(yùn)算,選擇算子作用于群體。選擇的目的是把優(yōu)化的個(gè)體直接遺傳到下一代或通過(guò)配對(duì)交叉產(chǎn)生新的個(gè)體再遺傳到下一代。選擇操作是建立在群體中個(gè)體的適應(yīng)度評(píng)估基礎(chǔ)上的。(6)交叉運(yùn)算:將交叉算子作用于群體。遺傳算法中起核心作用的就是交叉算子。(7)變異運(yùn)算:將變異算子作用于群體。即是對(duì)群體中的個(gè)體串的某些基因座上的基因值作變動(dòng),群體P(t)經(jīng)過(guò)選擇、交叉、變異運(yùn)算之后得到下一代群體P(t+1)。遺傳算法用于風(fēng)電功率預(yù)測(cè)有以下優(yōu)點(diǎn):它是以問(wèn)題集的串集進(jìn)行預(yù)測(cè)的,而不是以某個(gè)節(jié)點(diǎn)為依據(jù)進(jìn)行的預(yù)測(cè),這更有利于得到一個(gè)全局擇優(yōu)的結(jié)果,減少陷入局部最優(yōu)解的風(fēng)險(xiǎn)。且遺傳算法不是采用確定性規(guī)則,而是用概率變簽規(guī)則來(lái)進(jìn)行預(yù)測(cè)的,能夠做到模糊自適應(yīng),并且具有自組織、自適應(yīng)和自學(xué)習(xí)能力。遺傳算法以上的特征都保證了風(fēng)電效率的預(yù)測(cè)能有很好的精度。在遺傳算法中,如果某個(gè)體i的適應(yīng)度f(wàn)i種群大小為NP,則i被選擇的概率通過(guò)公式(2)計(jì)算:

實(shí)驗(yàn)結(jié)果和分析

評(píng)價(jià)標(biāo)準(zhǔn)和對(duì)照算法為了對(duì)風(fēng)電模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估,我們選用了平均絕對(duì)百分比誤差和均方根百分比誤差作為評(píng)估的手段。其公式如下所示:上述公式中N為預(yù)測(cè)的點(diǎn)數(shù),y(k)真實(shí)數(shù)據(jù),y~(k)模型產(chǎn)生的預(yù)測(cè)數(shù)據(jù)。這兩個(gè)公式主要用來(lái)評(píng)估預(yù)測(cè)值的實(shí)時(shí)誤差和時(shí)間段內(nèi)總體誤差率,能夠很好地反映出模型的單點(diǎn)和整體的預(yù)測(cè)效果。為驗(yàn)證本文提出的GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充樣本以及后續(xù)遺傳算法對(duì)于短期風(fēng)電功率預(yù)測(cè)性能,我們將長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為對(duì)比參照算法。LSTM是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測(cè)時(shí)間序列中間隔和延遲非常長(zhǎng)的情況,在風(fēng)電功率短期預(yù)測(cè)上已被證實(shí)是有效的方法

仿真實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

仿真實(shí)驗(yàn)使用的數(shù)據(jù)來(lái)自西班牙SotaventoGalicia風(fēng)場(chǎng),由風(fēng)場(chǎng)中的實(shí)時(shí)傳感器每10min對(duì)相關(guān)數(shù)據(jù)進(jìn)行采取,其中包括風(fēng)向角、風(fēng)速、發(fā)電功率等信息。本文使用SotaventoGalicia風(fēng)場(chǎng)2022年3月1日至3月15日采集的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其中包含了共2130個(gè)訓(xùn)練樣本。并將3月16日至3月20日共426條數(shù)據(jù)進(jìn)行保留,作為訓(xùn)練后模型的測(cè)試數(shù)據(jù)集。另外使用GAN神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行擴(kuò)充,共得到510個(gè)合成數(shù)據(jù)樣本,擴(kuò)充的訓(xùn)練數(shù)據(jù)集包含了2640個(gè)數(shù)據(jù)樣本。本文在pytorch深度學(xué)習(xí)框架中實(shí)現(xiàn)GAN神經(jīng)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練,用Python語(yǔ)言實(shí)現(xiàn)遺傳算法,實(shí)驗(yàn)計(jì)算機(jī)硬件配置為NVDIAGTA2060T顯卡和IntelCorei78700KCPU。訓(xùn)練中將GAN神經(jīng)網(wǎng)絡(luò)參數(shù)epoch設(shè)置為300,batchsize設(shè)置為18,學(xué)習(xí)率設(shè)置為0.001;遺傳算法基本參數(shù)設(shè)置為種群數(shù)量為20,終止代數(shù)為40,交叉概率為0.45,變異概率為0.01。為了驗(yàn)證本文的GAN神經(jīng)網(wǎng)絡(luò)合成數(shù)據(jù)和遺傳算法的風(fēng)電功率預(yù)測(cè)性能,本文共設(shè)計(jì)了3個(gè)對(duì)比實(shí)驗(yàn),第一個(gè)將擴(kuò)充訓(xùn)練數(shù)據(jù)集的2640個(gè)樣本數(shù)據(jù)作為遺傳算法的輸入,并且對(duì)3月16日到20日的短期風(fēng)電功率進(jìn)行預(yù)測(cè)。另外兩個(gè)對(duì)比實(shí)驗(yàn)僅僅只用到原始訓(xùn)練數(shù)據(jù)集的2130個(gè)訓(xùn)練樣本,分別用于遺傳算法和LSTM并對(duì)16日至20日的風(fēng)電功率進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果如圖3所示。通過(guò)上面的仿真結(jié)果對(duì)比,可以發(fā)現(xiàn)在未使用GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充訓(xùn)練數(shù)據(jù)集的情況下,遺傳算法依然優(yōu)于LSTM的預(yù)測(cè)性能,預(yù)測(cè)結(jié)果更加接近于真實(shí)值。而在3個(gè)對(duì)比仿真實(shí)驗(yàn)中,本文提出的GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合,取得了最優(yōu)異的預(yù)測(cè)結(jié)果。相對(duì)于未使用擴(kuò)充訓(xùn)練數(shù)據(jù)的遺傳算法的預(yù)測(cè)結(jié)果,GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的預(yù)測(cè)結(jié)果更加精準(zhǔn)且在整體趨勢(shì)上更貼合真實(shí)數(shù)據(jù)。這個(gè)結(jié)果說(shuō)明利用GAN神經(jīng)網(wǎng)絡(luò)合成的數(shù)據(jù)樣本,可以用來(lái)訓(xùn)練預(yù)測(cè)模型,且有助于提高最終的預(yù)測(cè)精確度。另外,為了研究不同數(shù)量訓(xùn)練樣本情況下,各類(lèi)算法的預(yù)測(cè)性能的區(qū)別以及GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充數(shù)據(jù)集對(duì)預(yù)測(cè)性能的提升效果,本文將SotaventoGalicia風(fēng)場(chǎng)2022年3月1日至3月15日采集的2130個(gè)訓(xùn)練樣本,其中的20%,50%,70%和全部樣本選取出來(lái),形成4個(gè)不同樣本數(shù)量的訓(xùn)練數(shù)據(jù)集。這4個(gè)訓(xùn)練數(shù)據(jù)集用于訓(xùn)練遺傳算法和LSTM,并對(duì)之后200個(gè)時(shí)間點(diǎn)風(fēng)電功率進(jìn)行預(yù)測(cè)。而本文提出的GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合方法,首先將使用GAN神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行擴(kuò)充,合成數(shù)據(jù)量基本為原樣本數(shù)量的25%,之后合成數(shù)據(jù)和原始訓(xùn)練數(shù)據(jù)合成為擴(kuò)充訓(xùn)練數(shù)據(jù)集,用于遺傳算法并對(duì)之后200個(gè)時(shí)間點(diǎn)風(fēng)電功率進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)中使用均方根百分比誤差對(duì)各模型的預(yù)測(cè)結(jié)果性能進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果如表1所示。從表1的實(shí)驗(yàn)結(jié)果看,在不同數(shù)量訓(xùn)練樣本情況下,遺傳算法的預(yù)測(cè)性能依然優(yōu)于LSTM算法。基于GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充數(shù)據(jù)集的方法,在樣本數(shù)量較小時(shí)也能取得較好的預(yù)測(cè)結(jié)果。隨著樣本訓(xùn)練集大小的不斷增加,各個(gè)模型的均方百分比誤差都在逐漸減小,這是因?yàn)椴粩嘣黾拥臉颖窘o模型預(yù)測(cè),提供了更多的信息和特征。GAN神經(jīng)網(wǎng)絡(luò)合成數(shù)據(jù)的提升效果也慢慢降低,但是依然對(duì)預(yù)測(cè)準(zhǔn)確度有一定程度地提升效果,比如在樣本只有總樣本20%和70%的時(shí)候,GAN神經(jīng)網(wǎng)絡(luò)生成數(shù)據(jù)集的提升效果分別為16.2%和8.12%,這可能是在數(shù)據(jù)量較小時(shí)模型獲得的信息更加匱乏,合成數(shù)據(jù)可能起到更大的作用。

技術(shù)總結(jié)

本文提出了基于GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法進(jìn)行短期風(fēng)電功率預(yù)測(cè),用來(lái)解決某些風(fēng)電場(chǎng)缺少歷史數(shù)據(jù)而難以預(yù)測(cè)發(fā)電功率的問(wèn)題。根據(jù)仿真實(shí)驗(yàn)結(jié)果,我們可以得出以下結(jié)論:當(dāng)樣本數(shù)據(jù)集較小的時(shí)候,我們可以利用GAN神經(jīng)網(wǎng)絡(luò)對(duì)抗生成數(shù)據(jù),并將生成數(shù)據(jù)用于模型的訓(xùn)練和預(yù)測(cè)當(dāng)中。它有助于提高預(yù)測(cè)的準(zhǔn)確率,減少樣本量過(guò)少帶來(lái)的影響;GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合,在缺少樣本的情況下,也可以有效地進(jìn)行短期風(fēng)電功率的預(yù)測(cè),相對(duì)于LSTM算法取得較好的一個(gè)預(yù)測(cè)結(jié)果。在進(jìn)一步的工作中,將充分探索GAN神經(jīng)網(wǎng)絡(luò)和其他算法的組合,在小樣本風(fēng)電功率預(yù)測(cè)上取得更精準(zhǔn)的結(jié)果。

作者:楊乘勝