版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-間歇故障

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

定義

間歇故障是指故障持續(xù)一段有限時間,不經(jīng)任何修復(fù)性維護(hù)活動,隨后又自行恢復(fù)執(zhí)行所需功能能力的一種故障。

間歇故障時隨機(jī)出現(xiàn)的和消失的故障,它沒有明確的模式或頻率。重復(fù)出現(xiàn)和消失,主要由系統(tǒng)內(nèi)部的缺陷(不穩(wěn)定的硬件和軟件)引起,而發(fā)生與否取決于某些特定的系統(tǒng)條件。間歇故障是一種間歇發(fā)生、難以預(yù)料的物理現(xiàn)象。一個有間歇故障的系統(tǒng),在間歇故障活躍期時,系統(tǒng)會產(chǎn)生錯誤結(jié)果;在間歇故障不活躍時,系統(tǒng)故障又將輸出正確結(jié)果。間接故障的特點(diǎn)是:在線檢測能發(fā)現(xiàn),而離線檢測難以發(fā)現(xiàn)。1

產(chǎn)生原因系統(tǒng)中產(chǎn)生間歇故障的原因多種多樣。機(jī)電系統(tǒng)中軸承和連桿機(jī)構(gòu)的不均勻磨損、裂隙;齒輪裝置中部分輪齒斷裂、磨損;液壓設(shè)備中閥門和汽缸的密閉性不嚴(yán)等均會導(dǎo)致間歇故障。在輸配電系統(tǒng)中,開關(guān)和繼電器的開合操作,機(jī)械應(yīng)力、化學(xué)用腐蝕和人為破壞導(dǎo)致的絕緣層損壞會使得不同電纜之間以及電纜與大地間出現(xiàn)間歇電弧故障,在電子設(shè)備尤其是大規(guī)模集成電路中,由于制造工藝不佳和不規(guī)范使用等導(dǎo)致的芯片管腳和連線松動, 以及環(huán)境中不同器件之間的電磁輻射和干擾等均會導(dǎo)致間歇故障的發(fā)生。在計算機(jī)系統(tǒng)中,接口不牢、電磁干擾和軟件缺陷,也會導(dǎo)致系統(tǒng)間歇故障。對于通信系統(tǒng)和傳感器網(wǎng)絡(luò),信道帯寬約束、量化誤差、網(wǎng)絡(luò)擁塞和節(jié)點(diǎn)競爭等也會使信息傳輸過程出現(xiàn)間歇故障。另外,設(shè)備運(yùn)行過程中溫度、濕度和機(jī)械應(yīng)力等環(huán)境條件的變化也會導(dǎo)致間歇故障的發(fā)生。2

研究意義間歇故障現(xiàn)象在生產(chǎn)和生活中十分普通,對系統(tǒng)性能和設(shè)備安全構(gòu)成了巨大的威脅。在機(jī)電系統(tǒng)中,機(jī)內(nèi)測試(Built-in test,BIT)系統(tǒng)是保證系統(tǒng)可靠性、提高可維護(hù)性和降低維修成本的重要裝置,而間歇故障是導(dǎo)致BIT系統(tǒng)出現(xiàn)虛警和影響設(shè)備可靠運(yùn)行的主要原因。在機(jī)電動力裝置中經(jīng)常出現(xiàn)的故障行為也大都是間歇性故障,例如牽引機(jī)本的電機(jī)系統(tǒng)就經(jīng)常出現(xiàn)間歇故障;另外,現(xiàn)代工業(yè)生產(chǎn)中感應(yīng)電機(jī)的應(yīng)用非常普遍,消耗了85% 左右的工業(yè)電力資源,而間歇故障是其主要的故障形式。另外,輸配電系統(tǒng)中的電弧放電現(xiàn)象。集成電路中電信號不規(guī)則波動等均是常見的間歇故障,嚴(yán)重影響設(shè)備的正常運(yùn)行。2

在電子電路系統(tǒng)中,間歇故障嚴(yán)重影響設(shè)各性能。例如,數(shù)字電子設(shè)備功能紊亂主要由間歇故障引起,而異常表現(xiàn)通常會在系統(tǒng)重啟后消失,給故障檢測帯來困難?;旌想娐分虚g歇故障發(fā)生頻率是永久故障的10~30倍,是造成系統(tǒng)失效的主要原因。數(shù)字電路系統(tǒng)中間歇故障占所有可能發(fā)生故障的90%,消耗了大部分維修費(fèi)用,且隨著技術(shù)和檢測手段的進(jìn)步,針對電子數(shù)字電路系統(tǒng)永久故障的檢測和維修費(fèi)用不斷降低,但針對間歇故障的檢測和維修費(fèi)用卻變化不大。研究中利用實(shí)驗表明:在大規(guī)模集成電路中,平均每7700小時發(fā)生一次永久故障,而平均每100小時就會發(fā)生一次間歇故障。在通信系統(tǒng)中,間歇故障也非常普遍,是影響通信質(zhì)量和縮短設(shè)備壽命的重要因素。來自美軍裝備和電子工業(yè)的統(tǒng)計數(shù)據(jù)表明,在戰(zhàn)場維修中,非永久故障(主要是間歇故障)占所有故障的50%以上,是造成不必要的維修、過早的設(shè)備更換等,造成了巨大的資源浪費(fèi)。2

除了傳統(tǒng)的機(jī)械和電子設(shè)備之外,在現(xiàn)代尖端科技領(lǐng)域中間歇故障也時有發(fā)生,對設(shè)備的可靠性運(yùn)行造成嚴(yán)重影響。例如,在航天器系統(tǒng)中,間歇故障在控制器中時有發(fā)生,嚴(yán)重影響容錯控制系統(tǒng)的正常工作,甚至導(dǎo)致航天器失穩(wěn);在高鐵系統(tǒng)的牽引電機(jī)、配電設(shè)備和傳感器系統(tǒng)中間歇故障也經(jīng)常出現(xiàn),對列車安全行駛構(gòu)成嚴(yán)重威脅。2

因此,對間歇故障的機(jī)理和特性進(jìn)行深入分析,探究針對間歇故障特點(diǎn)的故障診斷方法對于提高系統(tǒng)的可靠性與安全性、降低維修成本具有重要意義。2

分類方法根據(jù)上述對間歇故障發(fā)生機(jī)理和表現(xiàn)形式的分析,在此對間歇故障進(jìn)行分類:

1.按照照故障重復(fù)出現(xiàn)的方式可以分為:周期性間歇故障和非周期間歇故障;

2.按照故障幅值特點(diǎn),可以分為:固定幅值故障和時變幅值間歇故障;

3.按照不同時刻故障之間的相關(guān)性可以分為:獨(dú)立間歇故障和相關(guān)間歇故障。2

間接故障診斷的技術(shù)難點(diǎn)間接故障診斷極具挑戰(zhàn)性,一直是故障診斷領(lǐng)域國內(nèi)學(xué)者極力想解決的難點(diǎn)問題之一。間歇故障的出現(xiàn)可用右圖進(jìn)行定性地描述。如圖所示,數(shù)字“1”表示間歇故障狀態(tài)及持續(xù)時間,數(shù)字“0”表示恢復(fù)狀態(tài)及持續(xù)時間。 分別表示第1次和第n次間歇故障爆發(fā)的時間、頻率、概率及故障幅值或者說強(qiáng)度都具有一定的隨機(jī)性,而且不同產(chǎn)品間歇故障的失效機(jī)理不盡相同,有的間歇故障是由接觸不良引起的,而且有的是由于單粒子翻轉(zhuǎn)引起等。正是由于間歇故障的隨機(jī)性,給其診斷帶來了極大的困難。3

間接故障診斷研究現(xiàn)狀定性分析的方法基于定性分析的故障診斷主要依賴對系統(tǒng)運(yùn)行機(jī)理、故障特性以及故障行為與成因之間因果關(guān)系等先驗信息的分析,利用邏輯推理的方法檢測和分離故障。目前,基于定性分析的間歇故障方法可以分為基于圖論的方法、基于Petri網(wǎng)的方法、基于離散時間系統(tǒng)的方法等,另外還有少數(shù)從定性分析的角度對間歇故障的可診斷性進(jìn)行描述的文獻(xiàn)。2

定量分析的方法基于定量分析的故障診斷方法通過對研究對象構(gòu)建數(shù)學(xué)模型或者利用系統(tǒng)運(yùn)行過程的各種測量數(shù)據(jù),得到能夠表征故障對系統(tǒng)性能影響程度的殘差信息,然后對殘差進(jìn)行相應(yīng)的分析以達(dá)到故障診斷的目的。目前基于定量分析的間歇故障診斷方法可以分為基于模型的方法和基于數(shù)據(jù)的方法兩大類,其中基于模型的方法包括基于解析模型的方法和基于統(tǒng)計模型的方法;基于數(shù)據(jù)的方法可以分為基于統(tǒng)計特征分析的方法和基于決策優(yōu)化的方法等。除此之外,還有部分基于實(shí)驗方法的間歇故障診斷研究成果也值得關(guān)注。2

間接故障的調(diào)試交互式驅(qū)動程序調(diào)試器是個有效的工具,但是一些故障是依賴于時間的,當(dāng)使用斷點(diǎn)或單步運(yùn)行時,這些故障可能會消失,下面介紹幾種解決這種問題的技術(shù)。

計數(shù)器可用一對計數(shù)器在驅(qū)動程序中執(zhí)行幾種檢測。例如,計數(shù)器計算有多少個IRP到達(dá)驅(qū)動程序且有多少個被發(fā)送到IoCompleteRequest,或者在更高級別的驅(qū)動程序中,計算分配的IRP數(shù)目和能跟蹤的IRP泄露數(shù)目。類似這樣的檢測有助于發(fā)現(xiàn)驅(qū)動程序中微妙的矛盾。這種方法唯一的缺點(diǎn)是它們不能提供問題的所在位置。4

事件位另一個有用的技術(shù)是收集位標(biāo)志,位標(biāo)志在驅(qū)動程序中跟蹤重要事件的發(fā)生。每一位代表一個特定的事件、事件發(fā)生的時間,驅(qū)動程序令相應(yīng)位置位,計數(shù)器全局跟蹤驅(qū)動程序行為,事件位提供有關(guān)執(zhí)行代碼部分的信息。4

跟蹤緩沖器事件位和計數(shù)器均不能提供有關(guān)執(zhí)行代碼序列的信息,作為備選方案,可添加一個簡單的跟蹤機(jī)制,當(dāng)執(zhí)行驅(qū)動程序的不同部分時,該機(jī)制在特殊緩沖器中制作項。在異步或雙工驅(qū)動程序中,跟蹤意外作用時,跟蹤緩沖器非常有用。跟蹤緩沖器比計數(shù)器和事件位占用更多的CPU時間,這對時間敏感的故障不是很理想。

執(zhí)行跟蹤緩沖器的基本步驟為:

(1)為驅(qū)動程序添加跟蹤緩沖器數(shù)據(jù)結(jié)構(gòu),通常結(jié)構(gòu)應(yīng)出現(xiàn)在設(shè)備擴(kuò)展中,以便在設(shè)備基礎(chǔ)上發(fā)生跟蹤;

(2)在跟蹤緩沖器中定義宏來制作項,隨著其它調(diào)試代碼,把跟蹤宏和條件編輯聲明合在一起;

(3)在驅(qū)動程序的不同位置,插入跟蹤宏的調(diào)用;

(4)書寫調(diào)試器擴(kuò)展來讀出跟蹤緩沖器的內(nèi)容。4

待解決問題目前,對間歇故障診斷的研究還很不充分,理論研究尚處于探索階段,缺乏系統(tǒng)性的研究成果;尚未提出針對間歇故障特點(diǎn)的專門故障診斷方法。在對間歇故障的研究中,存在一些亟待解決的問題:

(1)間歇故障的嚴(yán)格定義和衡量指標(biāo)的問題。目前對于間歇故障只有定性的描述,一般把隨機(jī)發(fā)生、時有時無、可自行消失的故障稱為間歇故障,缺乏統(tǒng)一明確的嚴(yán)格定義和衡量指標(biāo)。2

(2)間歇故障特點(diǎn)對故障診斷效能的影響問題。目前的研究大都未考慮間歇故障的可檢測條件,對間歇故障在什么條件可檢測沒有給出定量的評價指標(biāo);另外,現(xiàn)有的成果在間歇故障的隨機(jī)性、間歇性等對故障檢測速率和檢測率等的影響方面也缺乏系統(tǒng)性的理論分析。2

(3)間歇故障檢測閾值的選取問題。不同于永久故障的檢測,因為間歇故障時有時無的特點(diǎn),其檢測閾值的設(shè)定十分困難。目前尚未見到關(guān)于如何設(shè)計間歇故障檢測閾值的研究結(jié)果。在后續(xù)研究中,可以考慮自適應(yīng)閾值和基于能量的閾值設(shè)計方法。2

(4)強(qiáng)干擾條件下間歇故障的檢測。間歇故障對系統(tǒng)狀態(tài)的影響與外界擾動和噪聲對系統(tǒng)的影響極為相似,很容易被掩蓋,從而導(dǎo)致診斷的失敗。目前的研究主要利用概率分析的方法來區(qū)分外界擾動和間歇故障對系統(tǒng)性能的影響,但需要已知間歇故障發(fā)生的概率,這在很多情況下是不可能的。2

(5)閉環(huán)系統(tǒng)中間歇故障的診斷。目前對間歇故障的研究大都是在開環(huán)系統(tǒng)的框架下進(jìn)行的。而在閉環(huán)系統(tǒng)中,由于反饋的補(bǔ)償作用,使得系統(tǒng)對故障具有一定的天然容錯能力,因此閉環(huán)系統(tǒng)的故障診斷成為故障診斷領(lǐng)域的研究難點(diǎn),而間歇故障因為閉環(huán)系統(tǒng)自身的容錯能力而更加難以診斷。2

(6)微小間歇故障的診斷。目前對間歇故障診斷的研究大都是基于故障幅值或能量在一定界限之上的假定。然而,間歇故障發(fā)生在初期,其幅值和能量很小,此時可以稱其為微小間歇故障,既具有間歇性,隨機(jī)性(周期性)和反復(fù)性的特點(diǎn),又受到幅值低、能量小的限制,其檢測和診斷更加困難。然而,微小間歇故障的準(zhǔn)確診斷可以有效提高系統(tǒng)的可靠性與安全性,對實(shí)際工業(yè)過程具有重要意義。2