野值點(diǎn)為采樣值的變化梯度在實(shí)際系統(tǒng)中一個(gè)采樣周期內(nèi)無法達(dá)到的點(diǎn)。在數(shù)學(xué)領(lǐng)域,野值點(diǎn)被記為第一類奇異點(diǎn)。
一般認(rèn)為,若設(shè) D={Y(T1),...Y(TN)} 為對動(dòng)態(tài)目標(biāo)的一序列跟蹤測t數(shù)據(jù)所組成的集合,D中嚴(yán)重偏離大部分?jǐn)?shù)據(jù)所呈現(xiàn)變化趨勢的一小部分?jǐn)?shù)據(jù)點(diǎn)稱為野值點(diǎn)。
野值點(diǎn)偽數(shù)據(jù)的特性是(1)產(chǎn)生是隨機(jī)的,在一次試驗(yàn)任務(wù)中以小概率發(fā)生,一般常見于初始段和目標(biāo)剛剛消失后幾秒到十幾秒內(nèi);
(2)在某時(shí)刻偽數(shù)據(jù)相對于其它跟蹤上目標(biāo)設(shè)備的測量數(shù)據(jù)可以看作是離群值;
(3)由于偽數(shù)據(jù)在( ,
)(i
(4)當(dāng)i=j時(shí)就是野值點(diǎn).可見,偽數(shù)據(jù)不同于異常數(shù)據(jù),有偽數(shù)據(jù)參與實(shí)時(shí)解算的結(jié)果在一段時(shí)間內(nèi)嚴(yán)重偏離真實(shí)結(jié)果,且由于其具有確定性趨勢濾波器一般是無法濾除偽數(shù)據(jù)的,同時(shí),偽數(shù)據(jù)隱蔽性強(qiáng),用常規(guī)方法不易識(shí)別.
**標(biāo)題:**圖1位置估計(jì)誤差及標(biāo)出的野值點(diǎn)**篇名:**多傳感器目標(biāo)跟蹤的實(shí)時(shí)剔野方法
**說明:**圖1給出了剔野后融合估計(jì)和用第三臺(tái)雷達(dá)的跟蹤數(shù)據(jù)結(jié)合反饋信息給出的估計(jì)的殘差圖的比較及標(biāo)記出的野值點(diǎn),由圖中可以看出,雖然有準(zhǔn)確的域1。
野值點(diǎn)的建模什么是野值?在探索性數(shù)據(jù)分析和數(shù)據(jù)處理領(lǐng)域中,野值又稱異常值(Outliers)。其定義一直不很明確,持不同態(tài)度的應(yīng)用統(tǒng)計(jì)學(xué)家對其定義也不一樣。對幾種常用的定義進(jìn)行過較為詳盡的剖析和比較。建議采用野值點(diǎn)的定義為:集合D中嚴(yán)重偏離大部分?jǐn)?shù)據(jù)所呈現(xiàn)趨勢的小部分?jǐn)?shù)據(jù)點(diǎn)。這一定義強(qiáng)調(diào)主體數(shù)據(jù)所呈現(xiàn)的“趨勢” ,以偏離數(shù)據(jù)集合主體的變化趨勢為判別異常數(shù)據(jù)依據(jù),并明確指出野值在集合D中只占小部分(即最多不超過一半),這從直觀上是合理的。本定義不但可以覆蓋簡單隨機(jī)抽樣情形,包括Edeworth (1887)的定義,而且也覆蓋了時(shí)間序列及隨機(jī)系統(tǒng)中的野值數(shù)據(jù)情形,具有較為廣泛的適應(yīng)性。
野值點(diǎn)的成因分析采樣數(shù)據(jù)集合中出現(xiàn)野值點(diǎn)的原因很多。就航天靶場試驗(yàn)的外測數(shù)據(jù)而言,產(chǎn)生野值主要有如下幾個(gè)方面的原因:
(1)操作和記錄時(shí)的過失,以及數(shù)據(jù)復(fù)制和計(jì)算處理時(shí)所出現(xiàn)的過失性錯(cuò)誤。由此產(chǎn)生的誤差稱為過失誤差(Gross Error)。
(2)采樣環(huán)境的變化。取樣母體的突然改變使得部分?jǐn)?shù)據(jù)與原先樣本的模型不符合,例如大地測量時(shí)地震或其它突變現(xiàn)象的出現(xiàn)、雷達(dá)跟蹤時(shí)應(yīng)答機(jī)工作狀態(tài)的不穩(wěn)定、靶場試驗(yàn)時(shí)飛行目標(biāo)的變軌與各級(jí)關(guān)機(jī)點(diǎn)附近的取樣,等等。
(3)實(shí)際采樣數(shù)據(jù)中也可能出現(xiàn)另一類異常數(shù)據(jù),它既不是來自操作和處理的過失也不是由突發(fā)性強(qiáng)影響因素導(dǎo)致的,而是某些服從長尾分布(long-tailed distribution)的隨機(jī)變量(例如,服從t分布的隨機(jī)變量)作用的結(jié)果。
野值點(diǎn)的分類工程采樣數(shù)據(jù)中出現(xiàn)的野值點(diǎn),比較常見的有如下幾種類型:
(1)離群點(diǎn)又稱跳點(diǎn),是統(tǒng)計(jì)診斷領(lǐng)域中研究得最多也比較成熟的一類。簡單隨機(jī)抽樣情形下,野值點(diǎn)主要表現(xiàn)為離群點(diǎn)。
(2)孤立型野值 它的基本特點(diǎn)是,某一采樣時(shí)刻ti處的測量數(shù)據(jù)是否為野值與 及
時(shí)刻數(shù)據(jù)的質(zhì)量無必然聯(lián)系。而且,比較常見的是當(dāng)
時(shí)刻的測量數(shù)據(jù)呈現(xiàn)異常時(shí),在ti時(shí)刻的一個(gè)鄰域內(nèi)(如
= {
,… ,
,…
}等時(shí)刻)采樣數(shù)據(jù)質(zhì)量是好的,即野值點(diǎn)的出現(xiàn)是孤立的。母體不相依情形下,動(dòng)態(tài)測量數(shù)據(jù)中孤立(isolated)異常值的出
現(xiàn)也是比較普遍的情形之一。
(3)野值斑點(diǎn) 簡稱斑點(diǎn)(Patchy),是指成片出現(xiàn)的異常數(shù)據(jù)。它的基本特征是,在 時(shí)刻出現(xiàn)的野值,也可能帶動(dòng)y(
-p+ 1),… , y(
)均嚴(yán)重偏離真值。雷達(dá)跟蹤高仰角目標(biāo)的測量數(shù)據(jù)序列中,野值斑點(diǎn)的出現(xiàn)是比較常見的故障現(xiàn)象2。
野值點(diǎn)的統(tǒng)計(jì)診斷對于簡單隨機(jī)抽樣情況下野值點(diǎn)的識(shí)別,孤立野值的診斷問題,也已經(jīng)有大量的研究成果可供采用;對于多個(gè)野值點(diǎn)(特別是斑點(diǎn)型野值)的診斷與處理,因涉及到誤差的前后相依性,見諸文獻(xiàn)的成功的處理方法或程序尚不多見。
考慮到斑點(diǎn)型野值點(diǎn)統(tǒng)計(jì)診斷的技術(shù)難度和工程實(shí)用價(jià)值,本文將對此進(jìn)行一些初步的探索和研究。本文的基本想法是,將長弧段測量數(shù)據(jù)集合中野值點(diǎn)的診斷和處理工作分成三個(gè)階段:
①容錯(cuò)處理:構(gòu)造一條穩(wěn)健的“柱心”軌線;
②可疑點(diǎn)的篩選:通過實(shí)測數(shù)據(jù)與該“柱心”軌線的比較,初步確定出可能包含野值點(diǎn)個(gè)數(shù)s及其所在位置( ,… ,
);
③統(tǒng)計(jì)診斷:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量和檢驗(yàn)門限,進(jìn)一步核實(shí)②中所確定的s個(gè)測量數(shù)據(jù)確實(shí)為異常數(shù)據(jù).
本詞條內(nèi)容貢獻(xiàn)者為:
杜強(qiáng) - 高級(jí)工程師 - 中國科學(xué)院工程熱物理研究所