王兆國 清華大學信息技術研究院,清華大學信息科學技術國家實驗室(籌)
劉座銘 國網吉林省電力有限公司電力科學研究院
徐麗媛 清華大學信息技術研究院,清華大學信息科學技術國家實驗室(籌)
李 靜 電網安全與節能國家重點實驗室(中國電力科學研究院)
薛一波 清華大學信息技術研究院,清華大學信息科學技術國家實驗室(籌)
1 引言
化石能源是目前全球主要消耗的能源,大量化石能源消耗導致環境污染、氣候變暖等諸多問題。近幾年清潔能源的使用,大力發展可再生能源已經成為全球共識。同期,我國提出全球能源互聯網戰略,實現風能、光能、水能和火能互補的發展戰略[1]。國家能源局印發的《風電發展“十三五”規劃》中明確指出,提高風能比重,實現風電由補充向替代能源轉變[2]。國家能源局發布風電并網統計數據,2016年新增風電裝機容量1930萬kW,風電發電量2410億kW h[3],可見風電正在逐步大規模并入電網。但風力發電易受到風向、風速、時間、季節等環境因素影響,具有間歇性和波動性等特性。這些多變因素給風力發電量精準預測、電網的調度、運行和控制帶來極大影響。僅2016年全社會用電量達59198億kW h,其中3.5%因電力預測的偏差,而白白消耗。
在電力預測方面,風電功率預測是指風電場風力發電機發電功率的預測,按照時間劃分主要包含:超短期預測、短期預測、中期預測和長期預測。超短期預測主要預測未來30min以內數據,主要用于風機智能控制及電能質量評估。短期預測一般預測未來30min到72h,主要用于電力系統調度、電力系統穩定和電能質量控制。中期預測一般預測未來數周或數月,主要用于設備狀態評估和制定維修計劃。長期預測是針對未來幾年的預測,主要用于發電廠投入決策和全年發電量預估。
按照預測方法劃分主要包含:持續法、時間序列分析法、卡爾曼濾波法、神經網絡、機器學習模型和組合預測方法。持續法[4]是通過將最近時刻的歷史風速值作為下一刻預測的方法,常用于超短期預測。時間序列分析法[5,6],主要通過系統采集的風功率數據,按照時間序列擬合曲線建模,并基于模型預測。卡爾曼濾波法[7,8]主要通過單一序列建立模型,基于卡爾曼濾波器原理實現預測,此類算法主要用于實時在線計算。神經網絡方法[9],如BP神經網絡等,是基于并行信息計算的算法模型,通過仿生物學原理利用神經元互通互聯提升系統模式識別能力,最新進展利用深度神經網絡方法完成風功率預測[10]。依據機器學習模型完成風功率預測的方法主要包含梯度提升[11]、支持向量機[12]、隨機森林[13]、K近鄰[14]等模型。組合預測[15-17]方法主要通過多種預測方法組合的方法,進而提高精度、減小誤差。
本文提出一種新型的風功率預測模型,該方法首先通過統計觀察歷史風機功率數據,發現風功率具有明顯季節變化特性,并基于季度風電功率數據建立多工況的風機預測模型。而對于同一時刻的多次天氣預報數據采用均值互補策略,消除偶然氣象數據的誤差。其次,利用構建好的歷史風電功率數據和氣象數據,建立隨機森林預測模型。實驗結果表明,本文方法具有較小的預測誤差,適用于多工況復雜的風電功率預測問題。
2 基于隨機森林的風功率預測模型
2.1 隨機深林模型建模過程
建立2001年Breiman提出隨機森林模型(RandomForest,RF)[18]。隨機森林模型是一個包含多個決策樹的分類器,以分類回歸樹(CART)作為元分類器,用Bootstrap完成有放回的重抽樣方法,從原始訓練數據中抽取多個樣本子集進行決策樹建模,通過多個決策樹基于投票原則得出最終結果。隨機森林模型具有計算精度高、泛化誤差可控、收斂速度快、有效解決不平衡分類等優點。
2.2 基于時間序列的風電功率建模
IEEE與Kaggle[20]機器學習比賽平臺聯合發起的GEFCom全球能源預測比賽之一的風力發電預測,數據集包含發電量數據和氣象數據。發電量數據為2009/7/1/1時至2010/12/31/24時之間以1小時為時段記錄,分別由七家發電站產生的真實發電量數據,清洗并歸一化處理后共18758條記錄。其中“date”參數表示數據采集時間,如“2009070100”表示為2009年7月1日0時?!皐p1-7”表示7個參數歸一化后的7家風電場的發電量數據,如“wp1 0.045”表示第一家風電場發電量為0.045,數據樣例如表1所示。
表1 風電功率數據示例
風電功率受限于風資源的變化,而風能資源易受到海陸熱力差異、行星風帶位置移動、風季環流等方面的影響,而形成季節性周期變化。為了探尋風電功率數據的季節性變化,本文將風電功率數據按照季度刻畫風電功率變化趨勢,如圖1所示。由圖1觀測可知,風電功率數據具有明顯季度變化特性,因此在建模時,分別按照不同季度單獨訓練模型,以提高預測的精度。
圖1 風電功率季節性變化趨勢圖
2.3 基于滑動均值的氣象信息模型
建立2001年Breiman提出隨機森林模型對發電量進行預測,重要依據是氣象數據,數據中包含了風的各項預報,包括風向、風速和相對的發電裝置的風向分量。氣象數據中“date”參數表示采集時間,如“2009070100”表示為2009年7月1日0時發布的氣象數據?!癶”參數表示未來某時刻數據,如“1”表示2009年7月1日1時預計的氣象數據;“u、v”分別表示相對于的發電裝置的風向分量;“ws(wind speed)”表示風速,通過標準化處理,將風速數據轉化為0~10的數據;“wd(wind direction)”表示風向數據,數據樣例如表2所示,每個風電場氣象數據約10萬條。
表2 氣象數據示例
氣象數據每日兩次分別于0時及12時發布,每次發布未來48小時的氣象預測數據,因此每個時間點至多有四次氣象預報數據,數據示例如圖2所示?;跀祿匦裕糠謿庀髷祿笔?,且同時刻多次預測數據均有浮動誤差,為了提高預測準確性,減小偶然誤差,本文采取滑動平均值方法完成氣象預測數據的平滑處理。
圖2 平滑均值氣象數據
2.3 基于隨機森林的風電功率預測流程
2001年,Breiman提出的隨機森林模型,對于風電功率預測主要包含:數據清洗與建模、多工況數據分類、機器學習模型訓練、實時氣象數據輸入、風電功率預測等幾個模塊,如圖3所示。數據清洗與建模主要包含對天氣預報數據的平滑均值處理和基于時間序列的風電功率分析,得到多工況的多個子數據集,并依據已有的機器學習模型分別對不同工況的子數據集建模,形成多工況的數據預測模型。當實時氣象數據作為數據輸入多工況風電功率預測模型時,模型自動預測并輸出預測的數據。
圖3 風電功率預測流程圖
3 實驗評估
3.1 實驗平臺與數據集說明
實驗平臺采用航天聯志Aisino5230R服務器,雙CPU共32核,DDR3-32G內存,4T硬盤,2MCache,前端總線1333Mhz, 實驗環境為SKlearn[21]。為了檢驗模型的準確性和抗過擬合能力,按照比賽規則:訓練數據集為2009/7/1/1時至2010/12/31/24時,間隔為1小時的風電功率數據和同時段的氣象數據,訓練過程采用實則交叉驗證方法防止過擬合。而測試集為2011/1/1/1時至2012/6/28/12時間隔1小時的風電功率數據和氣象數據。按照圖3的訓練測試流程,模型輸入為測試集的氣象數據,預測風電場的風電功率。
3.2 評價指標
均方根誤差(Root-Mean-Square Error,RMSE)是觀測值與真值偏差的平方和與觀測次數N比值的平方根。均方根誤差對觀測數據中的特大或者特小誤差反應敏感,因此均方根誤差能夠很好的反應出測量的精密度。在Kaggle[20]機器學習比賽中,均選擇RMSE作為模型評價標準。
3.3 實驗評估
按照圖3的系統測試流程,其預測結果與真值結果擬合度評估如圖4所示,其中橫坐標為2011/1/1/1時至2012/6/28/12時間隔1小時對應的氣象數據,縱坐標為相應時刻對應的風電功率。從圖4中觀測結果所示風電功率的預測曲線和真值曲線擬合度良好。
圖4 真實值與測量值擬合實驗
為了進一步評估算法和模型,選取普通最小二乘(Ordinary Least Square,OLS)、梯度提升(Gradient Boosting Regressor,GBR)、隨機森林(Random Forest Regressor, RFR)、K最近鄰(K Neighbors Regressor,KNN)完成模型構建和評估,并分別對七個風電場風電功率數據建模,并根據測試結果完成RSME評估,其檢測結果如表3所示。
由表3數據可知,本文提出基于不同季度數據和多工況預測模型在七個風電場中預測結果均表現優異,其中隨機森林模型的RSME為0.1371695,此結果優于Kaggle[20]機器學習比賽第一名成績0.14566。
表3 模型算法評估
4 結語
本文方法充分考慮風電特性,按照季度和多工況特性訓練多工況的風電功率預測模型。該模型具有較好的擬合特性和較低的均方根誤差值,其實驗結果表明本文方法優于Kaggle測評比賽中第一名成績,可見本文數據建模方法、模型選擇和模型訓練方面具有較好的特性,適合多工況復雜條件下的風功率預測。
基金項目: 國家科技支撐計劃資助項目(2015BAK34B00);國家電網公司科技項目互聯大電網一體化網絡分析計算支撐服務及關鍵技術研究(KY-SG-2016-031-JLDKY)
作者簡介
王兆國(1986-),男,黑龍江七臺河人?,F為清華大學信息技術研究院博士后,主要研究方向為電力大數據智慧分析、網絡與信息安全。
參考文獻:
[1] 劉振亞. 全球能源互聯網[M]. 北京: 中國電力出版社, 2015.
[2] 國家能源局. 國家能源局關于印發《風電發展“十三五”規劃》的通知[Z]. 北京: 國家能源局.
[3] 國家能源局. 2016年風電并網運行情況[Z]. 北京: 國家能源局, 2017.
[4] 李麗, 葉林. 基于改進持續法的短期風電功率預測[J]. 農業工程學報, 2010, 26(12): 182-187.
[5] Wang J, Hu J. A robust combination approach for short-term wind speed forecasting and analysis–Combination of the ARIMA (Autoregressive Integrated Moving Average), ELM (Extreme Learning Machine), SVM (Support Vector Machine) and LSSVM (Least Square SVM) forecasts using a GPR (Gaussian Process Regression) model[J]. Energy, 2015, 93: 41 - 56.
[6] Lydia M, Kumar S S, Selvakumar A I, et al. Linear and non-linear autoregressive models for short-term wind speed forecasting[J]. Energy Conversion and Management, 2016, 112: 115 - 124.
[7] Chen K, Yu J. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach[J]. Applied Energy, 2014, 113: 690 - 705.
[8] Zuluaga C D, Alvarez M A, Giraldo E. Short-term wind speed prediction based on robust Kalman filtering: An experimental comparison[J]. Applied Energy, 2015, 156: 321 - 330.
[9] Quan H, Srinivasan D, Khosravi A. Short-term load and wind power forecasting using neural network-based prediction intervals[J]. IEEE transactions on neural networks and learning systems, 2014, 25(2): 303 - 315.
[10] Hu Q, Zhang R, Zhou Y. Transfer learning for short-term wind speed prediction with deep neural networks[J]. Renewable Energy, 2016, 85: 83 - 95.
[11] Jiang Y, Xingying C, Kun Y U, et al. Short-term wind power forecasting using hybrid method based on enhanced boosting algorithm[J]. Journal of Modern Power Systems and Clean Energy, 2017, 5(1): 126 - 133.
[12] Liu Y, Sun Y, Infield D, et al. A hybrid forecasting method for wind power ramp based on Orthogonal Test and Support Vector Machine (OT-SVM)[J]. IEEE Transactions on Sustainable Energy, 2017, 8(2): 451 - 457.
[13] Lahouar A, Slama J B H. Hour-ahead wind power forecast based on random forests[J]. Renewable Energy, 2017, 109: 529 - 541.
[14] Yesilbudak M, Sagiroglu S, Colak I. A novel implementation of kNN classifier based on multi-tupled meteorological input data for wind power prediction[J]. Energy Conversion and Management, 2017, 135: 434 - 444.
[15] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122-137.
[16] Saleh A E, Moustafa M S, Abo-Al-Ez K M, et al. A hybrid neuro-fuzzy power prediction system for wind energy generation[J]. International Journal of Electrical Power & Energy Systems, 2016, 74: 384 - 395.
[17] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122 - 137.
[18] Breiman L. Random forests[J]. Machine learning, 2001, 45(1): 5 - 32.
[19] Krause J. Introduction to Bootstrap[M]. Introducing Bootstrap 4. Apress, 2016: 23 - 32.
[20] GEFCom2012. Global Energy Forecasting Competition 2012-Wind Forecasting[OL]. https://www.kaggle.com/c/GEF2012-wind-forecasting/leaderboard
[21] Scikit-learn. Scikit-learn[OL]. http://scikit-learn.org/stable/.
摘自《工業控制系統信息安全》專刊第四輯