如今是大數(shù)據(jù)時代,大數(shù)據(jù)的價值被越來越多的人所認知與關注。大數(shù)據(jù)對于電力系統(tǒng)來說既是機遇,也是挑戰(zhàn)。本文基于大數(shù)據(jù)中側重相關分析的思想,運用數(shù)據(jù)挖掘中皮爾遜關聯(lián)分析法分析電能質量各項監(jiān)測數(shù)據(jù)與電容器組故障統(tǒng)計數(shù)據(jù)的相關性,分析的結果表明電壓偏差和諧波電壓畸變率與電容器組故障的相關性最大,在各次諧波中三次諧波與電容器組故障的相關性最大,與普遍認知一致,從而驗證了大數(shù)據(jù)相關分析在電力系統(tǒng)中運用的有效性。
引言
中華人民共和國國民經濟和社會發(fā)展第十三個五年規(guī)劃綱要(簡稱“十三五”規(guī)劃(2016-2020年))中提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。在這樣的背景下,大數(shù)據(jù)的應用必然會越來越廣泛,創(chuàng)造的價值也必然會越來越多。然而,大數(shù)據(jù)帶來的不僅僅是機遇,還有挑戰(zhàn)。大數(shù)據(jù)帶來的挑戰(zhàn)不僅僅存在于技術方面,更重要的是思想方法和思維方式的變革。
大數(shù)據(jù)更側重相關關系的分析,而非因果關系,這是大數(shù)據(jù)帶來的挑戰(zhàn)之一。當數(shù)據(jù)的數(shù)學或物理模型不明確時,這一側重關聯(lián)分析的思想尤其有效,不同類別數(shù)據(jù)交叉關聯(lián)分析不僅能完成從數(shù)據(jù)到有用信息的轉化,完成數(shù)據(jù)分析與挖掘的基本工作,而且能避免數(shù)學或物理模型不確定所帶來的分析困難,提升數(shù)據(jù)的分析挖掘效率。因此,多類別數(shù)據(jù)交叉關聯(lián)分析是大數(shù)據(jù)思想的重要體現(xiàn),是大數(shù)據(jù)分析的重要理念之一。
在每天的運行中電網(wǎng)內部都會產生大量的數(shù)據(jù),這些數(shù)據(jù)主要包括以下三種類型:電網(wǎng)設備運行中的監(jiān)測數(shù)據(jù)、電網(wǎng)運營數(shù)據(jù)和電網(wǎng)管理數(shù)據(jù)。監(jiān)測數(shù)據(jù)包括調度運行數(shù)據(jù)、設備故障與檢修數(shù)據(jù)和GIS數(shù)據(jù)等;運營數(shù)據(jù)包括電力市場數(shù)據(jù)和客戶服務數(shù)據(jù)等電網(wǎng)外部數(shù)據(jù);管理數(shù)據(jù)包括電網(wǎng)內部行政管理的一些數(shù)據(jù)。由于用戶直接與配電網(wǎng)打交道,因此配電網(wǎng)運營數(shù)據(jù)的數(shù)量至少是輸電網(wǎng)中運營數(shù)據(jù)的數(shù)量十倍以上。除了電網(wǎng)內部數(shù)據(jù),電網(wǎng)外部數(shù)據(jù)諸如天氣數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)甚至日后的電動汽車GPS數(shù)據(jù)都會提供數(shù)量極大的數(shù)據(jù)以供分析和挖掘。
因此,運用大數(shù)據(jù)的方法對電網(wǎng)相關數(shù)據(jù)進行分析就顯得尤為重要。面對數(shù)量和維度都如此巨大的電網(wǎng)數(shù)據(jù)時,多變量交叉關聯(lián)分析更能凸顯出其優(yōu)越性。
目前,對電力系統(tǒng)中數(shù)據(jù)的挖掘與分析仍處于單一類別的分析狀態(tài),未將多類別數(shù)據(jù)聯(lián)合起來進行分析,導致很多有用的信息無法通過數(shù)據(jù)分析與挖掘得出。本文基于大數(shù)據(jù)中側重相關分析的思想方法,運用皮爾遜相關分析,對電網(wǎng)設備故障統(tǒng)計數(shù)據(jù)和電能質量監(jiān)測數(shù)據(jù)進行大量交叉分組關聯(lián)分析,分析的結果表明在眾多電網(wǎng)設備中,電容器組故障與電能質量監(jiān)測數(shù)據(jù)的相關性最強,而在眾多的電能質量指標中,電壓偏差與三次諧波電壓畸變率與電容器組故障的相關性最強,這與普遍認知一致。因此,大數(shù)據(jù)關聯(lián)分析可以在電力系統(tǒng)數(shù)據(jù)中完成從數(shù)據(jù)向有用信息的轉化,驗證了方法的有效性。
1 數(shù)據(jù)來源及關聯(lián)分析緯度
本文分析所用數(shù)據(jù)來源為2013年7月至2015年3月某市389個變電站的電能質量監(jiān)測數(shù)據(jù)和所有變電站統(tǒng)計的設備故障信息。設備故障數(shù)據(jù)主要包括110kV及以上變電站內的主變、電容器、電抗器、開關、避雷器、電壓互感器、電流互感器、GIS設備、有載調壓器和套管等設備的故障記錄。每條記錄中都包含故障設備所屬變電站,故障發(fā)生時間,故障類型等信息。將電容器和電抗器歸為一類、電壓互感器和電流骨干其歸為一類,則統(tǒng)計數(shù)據(jù)中各種類型設備故障發(fā)生次數(shù)統(tǒng)計如圖1所示,所有設備故障中電容器/電抗器發(fā)生故障的比重最大,達到42%。
電能質量監(jiān)測數(shù)據(jù)包括諧波電壓總畸變率、各次電壓諧波含有率、電壓偏差、電壓長時閃變和三相電壓不平衡度5個主要指標,包含各個相別中各個指標的最大值、平均值和95概率大值等。將上述兩組數(shù)據(jù)各個分量進行組合型關聯(lián)分析,關聯(lián)分析緯度如圖2所示。
2 關聯(lián)分析原理及其流程
2.1關聯(lián)分析原理
本文的關聯(lián)分析采用皮爾遜相關分析法,也稱為積差相關,是英國統(tǒng)計學家皮爾遜與20世紀提出的一種計算直線相關性的方法。其基本原理是假設存在兩個變量X,Y,那么兩變量的皮爾遜相關系數(shù)可以通過式(1)進行計算。
皮爾遜相關系數(shù)的范圍為[-1,1],絕對值越接近1,相關性越強;絕對值越接近于0,相關性越弱,相關系數(shù)小于0時表示兩個變量呈負相關,相關系數(shù)大于0時表示兩個變量呈正相關。一般皮爾遜系數(shù)大于0.2時,可認為兩個變量之間存在相關性。
2.2關聯(lián)分析流程
對電網(wǎng)設備故障統(tǒng)計數(shù)據(jù)與電能質量監(jiān)測數(shù)據(jù)進行關聯(lián)分析時,首先需要分別對電能質量監(jiān)測數(shù)據(jù)和電網(wǎng)設備故障統(tǒng)計數(shù)據(jù)進行預處理。
對電網(wǎng)設備故障統(tǒng)計數(shù)據(jù)的預處理包括兩個步驟:
挑選出已安裝電能質量監(jiān)測終端的變電站內的設備故障統(tǒng)計數(shù)據(jù),并將各變電站內的各類設備故障發(fā)生次數(shù)進行匯總;
將匯總得到的數(shù)據(jù)進行歸一化處理,變換至[0,1]之間;
由于電網(wǎng)設備故障是瞬時性的,而穩(wěn)態(tài)電能質量監(jiān)測數(shù)據(jù)是長期性的。本文針對電網(wǎng)設備發(fā)生次數(shù)統(tǒng)計與電能質量監(jiān)測數(shù)據(jù)進行關聯(lián)分析,因此只能計及電能質量監(jiān)測數(shù)據(jù)的空間特性,忽略時間特性。篩選出對應設備發(fā)生故障變電站,并獲取其電能質量監(jiān)測終端的監(jiān)測數(shù)據(jù),對監(jiān)測數(shù)據(jù)按以下步驟進行預處理:
整個監(jiān)測周期內電能質量監(jiān)測終端監(jiān)測得到的各電能質量指標最大值作為該變電站的電能質量指標最大值。
將電能質量監(jiān)測終端按月統(tǒng)計的各電能質量指標平均值在整個監(jiān)測周期內進行平均,獲得該變電站各電能質量指標的平均值。
整個監(jiān)測周期內容電能質量監(jiān)測終端按月統(tǒng)計的各電能質量指標95概率大值在整個監(jiān)測周期內做95概率大值進行計算,作為該變電站各電能質量指標的95概率大值。
對以上三個步驟中計算出的各變電站中各電能質量指標值進行歸一化處理,將所有數(shù)據(jù)變換至[0,1]之間。
通過數(shù)據(jù)的預處理,電網(wǎng)設備故障次數(shù)的統(tǒng)計數(shù)據(jù)和電能質量監(jiān)測的各項電能質量指標均映射為[0,1]區(qū)間的數(shù)值
通過皮爾遜相關分析法計算變量間的皮爾遜相關系數(shù),可獲得皮爾遜系數(shù)構成的mxn維的關聯(lián)矩陣,如式(4)所示。
關聯(lián)矩陣關聯(lián)矩陣中皮爾遜相關系數(shù)大于0.3的兩個變量可以認為具有相關性。
總結相關性分析流
電能質量監(jiān)測數(shù)據(jù)的預處理按如下步驟進行:
設備故障數(shù)據(jù)的預處理按如下步驟進行:
將預處理后電能質量監(jiān)測數(shù)據(jù)和設備故障數(shù)據(jù)進行正態(tài)分布檢驗或單峰分布檢驗,若檢驗未通過則進行適當?shù)淖儞Q使變換后的數(shù)據(jù)近似服從正態(tài)分布或單峰分布,縮小皮爾遜相關系數(shù)的計算誤差。
將通過正態(tài)分布或單峰分布檢驗的電能質量監(jiān)測數(shù)據(jù)和設備故障數(shù)據(jù)按變電站進行配對,準備計算各組數(shù)據(jù)的皮爾遜相關系數(shù)。
在完成數(shù)據(jù)的預處理后,對各設備和各電能質量指標進行大范圍、多角度的皮爾遜關聯(lián)分析,由于分析過程較長,故較詳細的分析過程不能在文章中給出。分析結果表明,電容器組故障與電能質量的相關性最強,因此,本文分析的重點放在電容器組故障與各電能質量指標相關性的分析。
3 關聯(lián)分析結果分析
3.1諧波電壓畸變率與電容/電抗器組故障統(tǒng)計數(shù)據(jù)
計算諧波電壓各監(jiān)測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù),各相諧波電壓監(jiān)測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù)的計算結果如表3所示。
各次諧波電壓含有率的95概率大值與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù)的計算結果如表4所示。
對于表3,首先從皮爾遜相關系數(shù)的正負性這個角度來分析。各相諧波電壓的最大值、平均值與95概率大值都與電容器組故障數(shù)據(jù)呈正相關,而各相諧波電壓合格率與電容器組故障數(shù)據(jù)都呈負相關,這符合我們的一般認知,說明計算結果合理、有效。其次從皮爾遜相關系數(shù)絕對值的大小這個角度來分析。我們可以看出,各相諧波電壓監(jiān)測項目中,諧波電壓最大值與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù)均為最小,95概率大值次之,平均值和合格率均大于之前二者,但平均值與合格率的相對大小因相別的不同而不同。
從皮爾遜相關系數(shù)的這個特征我們可以得出,電容器組故障對諧波電壓最大值不敏感,皮爾遜相關系數(shù)均小于0.1,從數(shù)據(jù)中無法得出二者存在相關性;而電容器組故障對諧波電壓的平均值和合格率較為敏感,皮爾遜相關系數(shù)的絕對值均在0.35左右,相關性存在的證據(jù)較為明顯。因此,從以上分析可以看出,諧波電壓對電容器組故障的影響是長期性的,對個別峰值不敏感,若諧波電壓長期處在較高水平,易引發(fā)電容器組的故障。
各次諧波對電容器組故障的影響可以很清晰地從表4中看出,其中三次諧波的諧波電壓95概率大值與電容器組故障數(shù)據(jù)的相關系數(shù)的絕對值最大,達到了0.405,已算中等程度相關,其他各次諧波相關性均比較小。因此,以減少電容器組故障為目標的諧波治理重點在三次諧波。
3.2電壓偏差與電容器組故障
計算電壓偏差各監(jiān)測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù),計算結果如表5所示。
分析表5中各電壓偏差監(jiān)測項目與電容器組故障的皮爾遜相關系數(shù)可以得出,A、B、C三相中A相電壓偏差與電容器組故障的相關性最大,A相電壓合格率的皮爾遜相關系數(shù)達到了-0.448,已屬于中等程度相關;B、C相電壓偏差與電容器組故障的相關性不明顯,數(shù)據(jù)無法支持二者存在相關性。在A相電壓偏差各監(jiān)測項目中,電壓偏差合格率的皮爾遜相關系數(shù)的絕對值最大,A相電壓最大值的皮爾遜相關系數(shù)的絕對值最小,因此,可以得出,在由A相電壓偏差引起的電容器組故障中,電壓峰值較電壓合格率影響較小,電容器組故障對電壓偏差的個別峰值不敏感,電壓偏差引起電容器組故障是一個長期過程。
3.3電壓長時閃變與電容器組故障
計算電壓閃變各監(jiān)測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù),計算結果如表6所示。各電壓閃變檢測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù)絕對值均很小,無法從現(xiàn)有數(shù)據(jù)中得到電壓閃變與電容器組故障之間存在相關性。
3.4三相電壓不平衡度與電容器組故障
完成對三相電壓不平衡度數(shù)據(jù)的預處理后,計算三相電壓不平衡度各監(jiān)測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù),計算結果如表7所示。
各三相電壓不平衡度檢測項目與電容器組故障數(shù)據(jù)的皮爾遜相關系數(shù)絕對值均很小,無法從現(xiàn)有數(shù)據(jù)中得到三相電壓不平衡度與電容器組故障之間存在相關性。
3.5各電能質量項目對電容器組故障的綜合對比
綜合諧波電壓、電壓偏差、電壓閃變和三相電壓不平衡度的皮爾遜相關系數(shù)計算結果,選取各電能質量監(jiān)測數(shù)據(jù)的最大值,95概率大值,平均值和合格率綜合進行對比、分析,對比結果如表8所示。
4 結論
通過對電能質量各監(jiān)測項目和電網(wǎng)設備故障統(tǒng)計數(shù)據(jù)的皮爾遜相關分析,可以得到某地區(qū)電容器組故障與電能質量的相關性最強,而在各項電能質量指標中,電壓偏差和三次諧波電壓畸變率與電容器組故障相關性最強,這與普遍認知一致。因此,基于大數(shù)據(jù)的思想方法,將皮爾遜相關分析應用在電網(wǎng)設備故障關聯(lián)特征提取這個場景中被證明是成功的。大數(shù)據(jù)思想方法和相關技術在電力系統(tǒng)其他應用場景中的應用仍需要進一步的探索和研究。
原標題:設備故障統(tǒng)計數(shù)據(jù)與電能質量監(jiān)測數(shù)據(jù)的關聯(lián)分析