故障容限是指當(dāng)其中一個(gè)或多個(gè)組件出現(xiàn)故障時(shí),該功能單元仍能繼續(xù)在規(guī)定的執(zhí)行水平運(yùn)用的范圍。
定義故障容限是在出現(xiàn)有限數(shù)目的硬件或軟件故障的情況下,系統(tǒng)仍可提供連續(xù)正確執(zhí)行的內(nèi)在能力。故障容限越大,軟件的容錯(cuò)能力就越強(qiáng)。
典型的故障容限設(shè)計(jì)當(dāng)檢測(cè)到故障時(shí)自動(dòng)使備用系統(tǒng)進(jìn)入在線狀態(tài)。當(dāng)電腦用于關(guān)鍵功能時(shí)故障容限的需求是無(wú)庸置疑的,例如導(dǎo)引飛機(jī)安全著陸或確保穩(wěn)定藥流輸入病人。故障容限對(duì)非關(guān)鍵的日常應(yīng)用也有好處。1
軟件容錯(cuò)軟件容錯(cuò)是容軟件故障(主要是設(shè)計(jì)故障)的手段和方法,其目的是屏蔽軟件故障,恢復(fù)因出故障而影響的運(yùn)行進(jìn)程。為了實(shí)現(xiàn)軟件容錯(cuò),一般都要使用某種形式的冗余,這種冗余既可以是設(shè)計(jì)(算法)冗余,也以是數(shù)據(jù)冗余。
實(shí)現(xiàn)軟件容錯(cuò)的基本方法,是將若干個(gè)根據(jù)同一規(guī)格說(shuō)明編寫的不同程序(或程序塊),在不同空間同時(shí)運(yùn)行或在同一空間依次運(yùn)行,然后在每一個(gè)預(yù)定的檢測(cè)點(diǎn)上通過(guò)表決或接收測(cè)試進(jìn)行裁決。在判明其正確或一致后接收這個(gè)結(jié)果,否則便加以拒絕,并作出報(bào)警。
容錯(cuò)軟件是一個(gè)規(guī)定功能的軟件,且:
(1)在一定程度上對(duì)自身故障的作用具有屏蔽能力;
(2)在一定程度上能從故障狀態(tài)自動(dòng)恢復(fù)到正常狀態(tài);
(3)在因軟件缺陷而出故障時(shí),能在一定程度上完成預(yù)期的功能;
(4)在一定程度上具有容錯(cuò)能力。2
相關(guān)概念故障(fault):元件或系統(tǒng)不能執(zhí)行正常的功能則謂之出故障。
故障檢測(cè)(fault detection):檢測(cè)設(shè)備的正確性但不確定故障的部位,叫故障檢測(cè)。
故障診斷(fault diagnosis):判斷設(shè)備有無(wú)故障及并確定故障的部位,叫故障診斷。
故障定位程序(fault location program):查找故障所在及其類型的程序,是診斷程序的重要部分。
故障測(cè)試(fault testing):觀察測(cè)試設(shè)備向邏輯電路輸入端施加測(cè)試碼的輸出響應(yīng),以確定電路中是否有故障或指明故障的位置的過(guò)程為故障測(cè)試。
本詞條內(nèi)容貢獻(xiàn)者為:
王慧維 - 副研究員 - 西南大學(xué)