一、引言
大力發展風力發電是我國能源領域的重大戰略任務,也是實現“雙碳”目標和能源結構轉型的必由之路。但是,受風速和風向的隨機性、負荷的不確定性、以及長期惡劣運行環境的影響,風電機組故障頻發。美國國家可再生能源實驗室對風電裝備零部件失效導致的停機維護時間進行了統計分析,累積分析了30200臺風電機組的各類故障導致的平均停機維護時間,結果如圖1所示。從圖中可見,齒輪箱等傳動部件失效導致的發電量損失占比最大。這是由于傳動鏈結構緊湊且部件繁多,加之長期處在變轉速、變載荷的工作狀態,更提高了傳動鏈部件故障發生的概率。因此,發展面向風電機組傳動鏈的健康狀態監測與故障診斷技術,有利于及時發現安全隱患、避免災難性事故,對于保障機組安全運行和提高風電場的經濟效益具有重要現實意義。
隨著風電機組的監測傳感器愈加密集,種類日益豐富,其監測數據規模呈現井噴式增長,風電運維進入“大數據”時代。其中,基于振動信號的監測與故障診斷方法應用最為廣泛,相關理論成果豐碩。國內外的專家學者們基于譜峭度分析、盲解卷積、隨機共振以及自適應分解等先進信號處理方法,開發出了多種用于風電傳動部件故障診斷的算法。近年來,基于數據驅動的智能故障診斷相關研究層出不窮。然而,這些方法實現高性能診斷需要滿足兩個基本前提:(1)有足量且故障類別豐富的有標簽數據用于模型訓練學習;(2)待診斷的測試數據和用于模型學習的訓練數據滿足獨立同分布的條件[7]。事實上,對于現役風電機組,上述前提往往很難滿足。首先,設備通常不被允許長期帶故障運行,因而難以獲取大量各類型故障模式的數據。另外,機組運行工況復雜多變,其監測數據的統計特性也隨之發生變化,從而出現新獲取的待診斷數據與用于模型構建的數據間存在分布差異,以至于訓練完備的模型在新數據上的分類預測與診斷性能嚴重下降。
在實際應用中,雖然獲取待測設備的各類別狀態數據較為困難,但通常存在若干其他可獲取的標記數據,例如同類型其他設備、實驗臺、公開數據集或仿真模型的數據等。通過合理使用這些可獲取數據(源域數據)來幫助目標任務(目標域)的學習,打破上述兩個前提,實現跨分布數據(跨域)的高性能診斷,不僅具有更高的工程可實施性也是故障診斷更高水平智能化的體現,對于解決實際診斷問題和數據驅動方法在故障診斷中的應用推廣均具有重要現實意義。
二、常見故障形式和數據特點
2.1 傳動鏈常見故障形式
風電機組的傳動鏈主要由主軸承、主軸、齒輪箱和聯軸器等部件組成,是增速和扭矩傳遞的關鍵設備。主軸承常采用雙列調心滾子軸承,齒輪箱則通常包括多級行星輪系和平行輪系,經多級傳動后增速比可達1:99左右。受交變載荷和復雜工況的影響,滾動軸承和齒輪箱是整個傳動系統中最易損壞的零部件。
滾動軸承的失效形式主要有金屬表面剝落、滾道磨損、塑性變形、銹蝕、金屬部件斷裂、表面膠合等,其故障原因多樣,可能引起振動和噪聲增大,并最終導致軸承失效。齒輪箱的主要作用是將低速風能穩定地利用于發電,提高主軸轉速。齒輪箱具有傳動比大、傳動功率大、布置緊湊等特點,常見的故障形式主要包括齒面點蝕、磨損、膠合、斷齒、塑性變形、軸承損壞以及軸斷裂等。
2.2 傳動鏈監測信號特點
載荷大范圍瞬時波動是風電傳動鏈的典型運行工況,這種載荷波動直接導致傳動部件的振動響應具有明顯的強時變、非平穩性。此外,傳動系統的多零部件結構導致了其復雜的多路傳輸路徑調制模式。具體表現在局部損傷激發的故障沖擊源與多個零部件的振動分量耦合或互相調制,使得測到的振動信號具有強烈的非線性。同時,低速重載的惡劣運行環境,以及風力機中的偏航系統、柔性支撐、液壓系統等子系統會誘發多類噪聲污染,使得故障響應變得極其微弱。這些因素都極大地增加了從原始信號中提取故障征兆成分的難度。還需指出的是,如引言中介紹,對于風電機組傳動部件的振動信號而言,設備結構參數、運行工況、傳感器安裝位置(振動信號傳遞路徑)、故障程度以及運行環境等因素的差異,都會使其統計特性發生變化。因此,無論是由于風的隨機性導致機組運行工況頻繁變化,還是在新投運機組的監測診斷場景中,待診斷數據都極有可能與已部署模型的訓練數據存在分布偏差。這種情況會顯著降低模型對測試數據的診斷準確率,增加誤診或漏診的風險。
三、跨域智能故障診斷研究現狀
遷移學習(TL)為實現分布偏差下的智能故障診斷提供了可行的技術支撐。TL是一種基于數據和任務的相似性,將在源域(源數據)中學習到的知識遷移并應用到另一個相似領域(目標數據)中的方法。通過放松訓練數據和測試數據需要服從相同分布的限制,解決了目標任務訓練數據不足的問題。此外,由于深度學習在特征提取方面的優勢,更有利于挖掘隱藏在數據背后的故障本質信息。因此,基于深度遷移學習技術(DTL)的跨域智能故障診斷成為實現風電機組傳動鏈運行狀態監測的前景技術之一。
借助DTL跨領域、跨分布的知識挖掘和遷移能力,涌現出大量關于跨域智能診斷方面的研究。它們針對不同跨域場景中的故障識別任務,構建了多種診斷模型,例如同設備跨工況場景、跨設備場景、仿真到實體(數字孿生)等。按照實際診斷任務中目標域數據的完備程度,現有跨域診斷研究涉及的場景主要可分為以下兩種:目標域缺少數據標簽和目標域數據不完備。
3.1 目標域缺少數據標簽場景下的跨域診斷
該場景中將源域知識遷移到目標域的過程也可稱為領域適應。通過將源和目標域數據投影到某個特征空間,并在該空間中學習與分布無關的域不變特征,從而縮小域間分布偏差,使得在源域建立的模型能夠很好的用于目標數據診斷。Wang等利用并通過最小化源和目標域特征的最大均值差異(MMD)實現分布對齊,進行軸承的跨工況診斷。Li等將參數遷移、基于MMD的特征適配以及集成學習相結合,提出一種集成深度遷移網絡用于滾動軸承的跨域故障診斷。Qin等將對抗領域適應網絡用于行星齒輪箱的跨域故障診斷。不同于上述的特征全局分布對齊,Chen等利用局部MMD縮小源和目標域同類別數據間的分布距離以獲取更細粒度的特征對齊。
上述研究主要關注單一源域到目標域的遷移策略,而在工程實際中,訓練數據可以從多個來源獲取。例如對于跨工況診斷任務,源域可以為多個不同歷史工況的數據。多個來源的非同分布數據蘊含了更豐富且多視角的知識,為提升對目標任務的診斷準確率提供了可能。目前,已有部分研究工作對基于多源域適應的跨域故障診斷問題進行了探討。
除上述方法外,一些特殊的領域適應方法也被用于解決不同場景下的故障診斷任務,例如部分域適應和開放集域適應,它們分別用于解決目標域標簽空間是源域標簽空間的子集和兩者僅共享部分類別場景中的診斷問題。
3.2 目標域數據不完備場景下的跨域診斷
該場景中目標域沒有可用于模型訓練的數據,或是僅有正常狀態數據,缺少故障數據。這種情況在工程診斷任務中十分常見,例如新投運的風電機組,其故障數據可能十分稀少,故障類別也不足。此外,風的隨機性導致機組的運行工況連續變化,新出現的待診斷工況可能是從而見過的,其監測數據無法提前獲取。這種情況下,由于沒有類別、數量充足的目標樣本用于引導特征分布對齊,3.1小節中的領域適應方法不再適用。目標域數據不完備的特點加大了構建有效的知識遷移策略的難度,也引發了工業應用對具有更高泛化性能的故障診斷模型的迫切需求。
Deng等提出一種基于階次譜遷移的跨域診斷方法,其利用階次譜建模和統計矩優化將目標域的故障特征遷移至源域分類模型中,從而降低對目標域故障樣本的依賴。該方法以模型驅動為主,需要大量的故障機理和信號處理知識的支撐。從數據驅動的角度看,由于不同來源數據間的潛在分布差異是阻礙模型泛化的主要原因,因此從多個源域中學習與領域分布無關的共性特征是解決該問題的一條可行途徑,該策略也是現有研究工作采用的主要方法。Zheng等利用Fisher判別分析將不同源域描述為Grassmann流行上的多個點,通過計算它們的平均子空間來學習共性判別結構,從而提高模型的泛化性能和實現對目標樣本的模式識別。該研究團隊還在文獻中針對此場景提出一種基于先驗診斷知識的跨域診斷方法,利用角域重采樣和希爾伯特變換獲取原始振動數據的包絡信號,目的是消除監測數據中部分由運行工況等因素引起的特性差異,然后將其輸入CNN進行故障診斷。為了充分利用源域數據的標簽信息,Zhang等采用條件對抗訓練對齊多個不同工況數據集的條件分布,從而學習它們的域不變特征,實現了對未知工況的診斷。在風電裝機容量快速增長以及機組運行工況復雜多變的背景下,面向未知分布的監測數據的跨域故障診斷研究很好的滿足了當前的應用需求,同時對于發展機組的實時狀態監測與故障診斷技術也具有積極的借鑒意義。
四、結論與展望
早期風電裝備的快速發展使得風電裝備陸續進入故障高發期,傳動鏈作為風電機組的重要組成部分,對其進行狀態監測和故障診斷是保證機組穩定運行的關鍵。鑒于風電監測數據的分布特性,國內外研究者基于遷移學習提出了各種各樣的跨域診斷方法和策略。但該研究領域方興未艾,尚有許多科學和工程問題有待解決,仍需在以下方面開展大量研究。
(1)領域邊界模糊情況下的跨域診斷研究
現有跨域遷移診斷研究大多基于不同分布數據有著明確領域標簽的假設,即一段數據來自哪臺設備或是哪種工況會被清晰標注。但是,風電機組運行工況頻繁變化,其監測數據通常包含多種工況且邊界模糊。因此可用于模型訓練的數據內部分布混雜,不利于從中學習具有一致性判別能力的故障表征。這種沒有領域標簽的混合域遷移診斷是風電運行狀態監測中值得研究的內容。
(2)分布式風電傳動鏈故障診斷研究
單一風電場具有眾多監測數據,但故障樣本有限,難以支持數據驅動的診斷模型構建。雖然可以基于實驗室模擬數據,利用本文介紹的遷移學習方法構建跨域診斷模型,但現有試驗臺通常與真實風電裝備差異較大,導致遷移效果有限,而建立同規模的試驗裝置成本十分高昂。解決上述問題的一個可行方案是集中多個風電場的數據來訓練模型,這種數據集中式建模也是當前數據驅動模型構建采取的主要方式。但在現代工業中,數據隱私問題至關重要。不同風電企業之間的數據共享通常是被嚴格禁止的,即使在同一企業內部,集中多個風電場數據也會受到有限通信資源的制約。因此,如何在數據非共享的約束下,構建可靠的跨域故障診斷模型是當前風電智能運維未來的發展方向之一。
作者:史曜煒 南京郵電大學物聯網學院 鄧艾東 東南大學能源與環境學院