色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁 > 博客 > 基于SARIMA、XGBoost和CNN-LSTM的時間序列預(yù)測對比(1)

          基于SARIMA、XGBoost和CNN-LSTM的時間序列預(yù)測對比(1)

          發(fā)布人:數(shù)據(jù)派THU 時間:2022-12-23 來源:工程師 發(fā)布文章

          利用統(tǒng)計測試和機器學(xué)習(xí)分析和預(yù)測太陽能發(fā)電的性能測試和對比。

          本文將討論通過使用假設(shè)測試、特征工程、時間序列建模方法等從數(shù)據(jù)集中獲得有形價值的技術(shù)。我還將解決不同時間序列模型的數(shù)據(jù)泄漏和數(shù)據(jù)準(zhǔn)備等問題,并且對常見的三種時間序列預(yù)測進(jìn)行對比測試。

          介紹

          時間序列預(yù)測是一個經(jīng)常被研究的話題,我們這里使用使用兩個太陽能電站的數(shù)據(jù),研究其規(guī)律進(jìn)行建模。首先將它們歸納為兩個問題來解決這些問題:

          1. 是否有可能識別出性能欠佳的太陽能組件?
          2. 是否可以預(yù)報兩天的太陽能發(fā)電量?


          在繼續(xù)回答這些問題之前,讓我們先了解太陽能發(fā)電廠是如何發(fā)電的。

          圖片

          上圖描述了從太陽能電池板模塊到電網(wǎng)的發(fā)電過程。太陽能通過光電效應(yīng)直接轉(zhuǎn)化為電能。當(dāng)硅(太陽能電池板中最常見的半導(dǎo)體材料)等材料暴露在光線下時,光子(電磁能量的亞原子粒子)被吸收并釋放自由電子,從而產(chǎn)生直流電(DC)。使用逆變器,直流電被轉(zhuǎn)換成交流電(AC)并發(fā)送到電網(wǎng),在那里它可以被分配到家庭。

          數(shù)據(jù)

          原始數(shù)據(jù)由每個太陽能發(fā)電廠的兩個逗號分隔值(CSV)文件組成。一份文件顯示了發(fā)電過程,另一份文件顯示了太陽能發(fā)電廠傳感器記錄的測量數(shù)據(jù)。每個太陽能發(fā)電廠的兩個數(shù)據(jù)集都被整理成一個pandas的df。

          太陽能發(fā)電廠1號(SP1)和太陽能發(fā)電廠2號(SP2)的數(shù)據(jù)每15分鐘收集一次,從2020年5月15日到2020年6月18日。SP1和SP2數(shù)據(jù)集都包含相同的變量。

          • Date Time -間隔15分鐘
          • Ambient temperature-模塊周圍空氣的溫度
          • Module temperature-模塊的溫度
          • Irradiation——模塊上的輻射
          • DC Power (kW)  -直流
          • AC Power (kW) -交流
          • Daily Yield-每日發(fā)電量總和
          • Total Yield-逆變器的累計產(chǎn)量
          • Plant ID -太陽能電站的唯一標(biāo)識
          • Module ID  -每個模塊的唯一標(biāo)識


          天氣傳感器用于記錄每個太陽能發(fā)電廠的環(huán)境溫度、組件溫度和輻射。

          對于這個數(shù)據(jù)集直流功率將是因變量(目標(biāo)變量)。我們目標(biāo)是試圖找到性能不佳的太陽能模塊。

          兩個獨立的df用于分析和預(yù)測。唯一的區(qū)別是用于預(yù)測的數(shù)據(jù)被重新采樣為每小時的間隔,而用于分析的數(shù)據(jù)幀包含15分鐘的間隔。

          首先我們刪除Plant ID,因為它對試圖回答上述問題沒有任何價值。Module ID也從預(yù)測數(shù)據(jù)集中刪除。表1和表2顯示了數(shù)據(jù)示例。

          圖片

          圖片

          在繼續(xù)分析數(shù)據(jù)之前,我們對太陽能發(fā)電廠做了一些假設(shè),包括:

          • 數(shù)據(jù)采集儀器無故障;
          • 模塊定期清洗(忽略維護(hù)的影響);
          • 兩個太陽能電站周圍都沒有遮擋問題。

          探索性數(shù)據(jù)分析(EDA)

          對于數(shù)據(jù)科學(xué)的新手來說,EDA是通過繪圖可視化和執(zhí)行統(tǒng)計測試來理解數(shù)據(jù)的關(guān)鍵一步。我們首先通過繪制SP1和SP2的DC和AC,可以觀察到每個太陽能發(fā)電廠的性能。

          圖片

          SP1顯示的直流功率比sp2高一個數(shù)量級。假設(shè)SP1采集的數(shù)據(jù)是正確的,用于記錄數(shù)據(jù)的儀器沒有故障,這就說明SP1中逆變器需要進(jìn)行更深入的研究。

          圖片

          通過按每個模塊的日頻率聚合AC和DC功率,圖3顯示了SP1中所有模塊的逆變器效率。根據(jù)領(lǐng)域內(nèi)知識,太陽能逆變器的效率應(yīng)該在93-96%之間。由于所有模塊的效率范圍為9.76% - 9.79%,這里可以說明需要調(diào)查逆變器的性能,以及是否需要更換。

          由于SP1顯示了逆變器的問題,因此僅在SP2上進(jìn)行了進(jìn)一步的分析。

          盡管這一小段分析是我們花了更多的時間對逆變器進(jìn)行研究,但它并沒有回答確定太陽能模塊性能的主要問題。

          由于SP2的逆變器正常工作,可以通過深入挖掘數(shù)據(jù),來識別和調(diào)查任何異常情況。

          圖4中顯示了模塊溫度和環(huán)境溫度之間的關(guān)系,并且有模塊溫度極高的情況。

          圖片

          這看起來似乎違反我們的認(rèn)知,但是可以看到高溫對太陽能電池板的確有負(fù)面影響。當(dāng)光子與太陽能電池內(nèi)的電子接觸時,它們會釋放自由電子,但在更高的溫度下,更多的電子已經(jīng)處于激發(fā)態(tài),這降低了電池板可以產(chǎn)生的電壓,進(jìn)而降低了效率。

          考慮到這一現(xiàn)象,下面的圖5顯示了SP2的模塊溫度和直流功率(環(huán)境溫度低于模塊溫度的數(shù)據(jù)點和模塊運行數(shù)量較少的一天中的時間已經(jīng)過過濾,以防止數(shù)據(jù)傾斜)。

          圖片

          在圖5中,紅線表示平均溫度。這里可以看到有一個明確的臨界點和直流電源停滯的跡象。在~52°C開始平穩(wěn)。為了找到性能次優(yōu)的太陽能模塊,所有顯示模塊溫度超過52°C的行都被刪除。

          下面的圖6顯示了SP2中每個模塊在一天中的直流功率。這樣就基本符合了預(yù)期,午間發(fā)電量較大。但是還有個問題,在運行高峰時期,發(fā)電量較低。我們很難總結(jié)造成這種情況的原因,因為當(dāng)天的天氣條件可能很差,或者SP2可能需要進(jìn)行日常的維護(hù)等等。

          圖6中也有低性能模塊的跡象。它們可以被識別為圖上偏離最近群集的模塊(單個數(shù)據(jù)點)。

          圖片

          為了確定哪些模塊表現(xiàn)不佳,我們可以進(jìn)行統(tǒng)計測試,同時將每個模塊的性能與其他模塊進(jìn)行比較,從而確定性能。

          每隔15分鐘,不同模塊的直流電源在同一時間的分布是正態(tài)分布,通過假設(shè)檢驗可以確定哪些模塊表現(xiàn)不佳。計數(shù)是指模塊落在99.9%置信區(qū)間之外且p值< 0.001的次數(shù)。

          圖7按降序顯示了每個模塊在統(tǒng)計上顯著低于同期其他模塊的次數(shù)。

          圖片

          從圖7中可以清楚地看出,模塊' Quc1TzYxW2pYoWX '是有問題的。這些信息可以提供給SP2的相關(guān)工作人員,調(diào)查原因。


          *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



          關(guān)鍵詞: AI

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉