數(shù)據(jù)挖掘在電站故障預(yù)警的應(yīng)用

時間:2022-12-25 10:55:24

導(dǎo)語:數(shù)據(jù)挖掘在電站故障預(yù)警的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在電站故障預(yù)警的應(yīng)用

摘要:近年,電站企業(yè)從自動化轉(zhuǎn)型為信息化、智能化的需求升高,通過對電站DCS中儲存的大量數(shù)據(jù)進行分析,能夠提示設(shè)備劣化狀態(tài),對電站企業(yè)提高生產(chǎn)效率、經(jīng)濟安全運行有積極的指導(dǎo)意義。將數(shù)據(jù)挖掘應(yīng)用于電站數(shù)據(jù)分析,試圖為電站安全性運行提供理論依據(jù)。介紹了數(shù)據(jù)挖掘的概念,著重研究了數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理、聚類、回歸的方法,之后將該方法應(yīng)用于實際電站的預(yù)警中取得了較好的效果。

關(guān)鍵詞:數(shù)據(jù)挖掘;故障預(yù)警;聚類;回歸

電站設(shè)備的可靠、安全運行是各個發(fā)電企業(yè)管理者最為關(guān)注的事情。同時,為了追求高利潤,就需要合理安排檢修周期和內(nèi)容。實現(xiàn)設(shè)備的高可靠性運行與減少檢修費用的雙向需求,是電廠管理者的難題,往往現(xiàn)場人員少、任務(wù)多,能夠讓計算機代替人員在海量的數(shù)據(jù)中挖掘出有價值的信息,并主動、準確地發(fā)現(xiàn)設(shè)備潛在的問題,幫助電站有重點、合理的安排檢修計劃。目前大多電站主要以DCS報警為依據(jù)對設(shè)備進行故障狀態(tài)觀察,這些傳統(tǒng)的技術(shù)方法無法發(fā)現(xiàn)數(shù)據(jù)背后隱藏的規(guī)律,很難了解設(shè)備運行的劣化狀態(tài),造成了數(shù)據(jù)資源的巨大浪費。近年來,數(shù)據(jù)挖掘隨著計算機性能的發(fā)展越來越多的得到了人們的關(guān)注,它是一門利用數(shù)據(jù)庫、統(tǒng)計學(xué)、人工智能、專家知識庫等知識,把海量歷史數(shù)據(jù)作為研究對象,對這些數(shù)據(jù)通過分類、關(guān)聯(lián)規(guī)則分析、回歸擬合等方式進行分析、處理,從而挖掘出隱藏在數(shù)據(jù)中有用的知識,幫助管理者和技術(shù)人員決策提供有力的依據(jù)。將數(shù)據(jù)挖掘應(yīng)用于電站故障預(yù)警中,可幫助電站實現(xiàn)預(yù)測性檢修管理,在保證設(shè)備安全有效的情況下,減少檢修費用。

1數(shù)據(jù)挖掘

1.1數(shù)據(jù)預(yù)處理過程。在工況復(fù)雜的工業(yè)電站中傳感器數(shù)據(jù)通過DCS讀取和傳輸,傳感器數(shù)據(jù)往往會因為環(huán)境影響產(chǎn)生數(shù)值跳變或者損壞。為了提高預(yù)警建模的準確性,首先我們需要提高數(shù)據(jù)的質(zhì)量,清除數(shù)據(jù)中的噪聲,糾正不一致。數(shù)據(jù)預(yù)處理就是將準確、完整、一致、可信的數(shù)據(jù)提取出來。數(shù)據(jù)預(yù)處理通過數(shù)據(jù)清理、數(shù)據(jù)集成的方式來完成。通過填寫缺失值,光滑噪聲數(shù)據(jù),識別或刪除離群點對原始數(shù)據(jù)進行清理。首先對于采集的數(shù)據(jù)進行偏差檢測,對于錯誤和退化的數(shù)據(jù)進行分離或者修正。數(shù)據(jù)的缺失值采用回歸基于推理的方式填寫。噪聲數(shù)據(jù)采用分箱的方法將數(shù)據(jù)分成多個不同的區(qū)間,進行箱中位數(shù)光滑或者箱邊界光滑。同時設(shè)置數(shù)據(jù)上下限過濾和時間過濾,可按照上下限或時間對于故障數(shù)據(jù)、停機數(shù)據(jù)進行過濾處理。對于一般的離群點數(shù)據(jù)進行分析,對于無效數(shù)據(jù)刪除,離群點清理如圖所示。1.2數(shù)據(jù)聚類。數(shù)據(jù)挖掘中主要的數(shù)據(jù)類別定義算法是分類和聚類,其中分類算法常見的有KNN、決策樹、支持向量機、樸素貝葉斯等,聚類算法常見的有K-means、DBSCAN等。本文選取的是聚類算法k-means,該算法是無監(jiān)督學(xué)習(xí)算法可以在不定義樣本類別的情況下,自動的根據(jù)數(shù)據(jù)特征進行迭代分析從而聚類。該算法的主要思想是將數(shù)據(jù)分為K類,則隨機選取K個對象作為初始的聚類中心,然后計算每條數(shù)據(jù)與定義過的中心之間的距離,把該條數(shù)據(jù)分配給距離它最近的一個聚類中心。聚類中心以及分配給它的所有數(shù)據(jù)條就代表一個類。系統(tǒng)會不斷迭代計算聚類中心直到滿足條件結(jié)束,一般來說就是每條數(shù)據(jù)到聚類中心的誤差平方和最小為最佳聚類方案。迭代方法,給定數(shù)據(jù)集劃分假設(shè)的聚類數(shù)K,每個類各自一個聚類中心:準則函數(shù):ᥘᥘ1.3標準值預(yù)測模型。將數(shù)據(jù)分類后,對機理意義上數(shù)據(jù)相關(guān)的兩個或多個屬性進行數(shù)據(jù)挖掘找尋他們之間的關(guān)系建立標準值預(yù)測模型。本文標準值預(yù)測模型選取的算法是回歸算法,回歸算法模型中利用梯度下降法對損失函數(shù)求最優(yōu)解。損失函數(shù):ᥘᥘᥘᥘᥘ批梯度下降:ᥘᥘᥘᥘᥘᥘ

2數(shù)據(jù)挖掘在電站故障預(yù)警中的應(yīng)用

2.1省煤器泄漏預(yù)警。鍋爐水冷壁、過熱器、再熱器和省煤器為火電最易發(fā)生泄漏的四類受熱面,他們造成的泄漏統(tǒng)稱為“四管泄漏”。在發(fā)電機組的非計劃停運統(tǒng)計中,鍋爐四管泄漏占30%以上,在具體泄漏表現(xiàn)形式中,爆管約占90%。在泄漏事故發(fā)生時,影響重大,不僅對機組的穩(wěn)定運行構(gòu)成了嚴重威脅,影響發(fā)電指標的完成和導(dǎo)致經(jīng)濟效益降低,影響機組壽命,而且還直接影響到電網(wǎng)的正常調(diào)度,鍋爐四管泄漏的防治是電廠的重點工作,對因四管泄漏造成的非計劃停運意義很大。本文針對省煤器泄漏進行分析,選取測點為:省煤器入口煙溫、省煤器出口煙溫、主蒸汽流量。2.2省煤器預(yù)警模型。首先利用k-means算法將選擇的3個屬性的數(shù)據(jù)進行聚類,經(jīng)過驗證當(dāng)k取值為4時,聚類誤差最小。然后將每個類別的數(shù)據(jù)(選取省煤器入口煙溫、省煤器出口煙溫)利用回歸算法進行曲線擬合。擬合結(jié)果圖如下。2.3省煤器泄漏預(yù)警模型在電站中的應(yīng)用。下圖是某電廠省煤器出口煙溫實時值和模型輸出正常值的曲線圖,曲線中可以看出當(dāng)泄漏故障發(fā)生時實際值和正常值發(fā)生明顯偏離,根據(jù)數(shù)據(jù)偏離提示與現(xiàn)場省煤器位置進行驗證,發(fā)現(xiàn)省煤器部分確實有少量泄漏現(xiàn)象,經(jīng)過現(xiàn)場工作人員檢修后,數(shù)據(jù)恢復(fù)正常。

3結(jié)論

省煤器是電站鍋爐系統(tǒng)的主要設(shè)備,在應(yīng)用中及時發(fā)現(xiàn)了省煤器泄漏風(fēng)險,經(jīng)提示現(xiàn)場及時檢修避免了故障進一步擴大,基于數(shù)據(jù)挖掘的預(yù)警模型建立為機組安全性運行提供了有效依據(jù)。

參考文獻

[1]湯羽,林迪.大數(shù)據(jù)分析與計算[M].2018.

[2]DHand,HMannila,PSmith.PrincipleofDataMining[M].2011.

[3]沙德生,陳江.火電廠設(shè)備狀態(tài)檢修技術(shù)與管理[M].2016.

作者:張振宇 孟兆博 亓皓寬 單位:哈爾濱電站設(shè)備成套設(shè)計研究所有限公司