版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-殘差

科學百科
原創(chuàng)
科學百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

普通殘差

設(shè)線性回歸模型為 其中Y是由響應(yīng)變量構(gòu)成的n維向量,X是 階設(shè)計矩陣,β是p+1維向量,ε是n維隨機變量。

回歸系數(shù)的估計值,擬合值,其中,稱H為帽子矩陣。殘差為

這解釋了帽子矩陣與殘差的關(guān)系,因為殘差可以通過帽子矩陣與真實值得出。

內(nèi)學生化殘差由差向量ε的的性質(zhì),得到。因此,對每個,有,其中是矩陣H對角線上的元素。

作為的估計值,稱為標準化殘差,或者稱為內(nèi)學生化殘差。這因為的估計中用了包括第i個樣本在內(nèi)的全部數(shù)據(jù)。由可知,標準化殘差近似服從標準正態(tài)分布。

外學生化殘差若記刪除第i個樣本數(shù)據(jù)后,由余下的n-1個樣本數(shù)據(jù)求得的回歸系數(shù)為,做的估計值,有,其中為設(shè)計矩陣X的第j行。稱為學生化殘差,或者稱為外學生化殘差。1

特征在回歸分析中,測定值與按回歸方程預(yù)測的值之差,以δ表示。殘差δ遵從正態(tài)分布N(0,σ2)。(δ-殘差的均值)/殘差的標準差,稱為標準化殘差,以δ*表示。δ*遵從標準正態(tài)分布N(0,1)。實驗點的標準化殘差落在(-2,2)區(qū)間以外的概率≤0.05。若某一實驗點的標準化殘差落在(-2,2)區(qū)間以外,可在95%置信度將其判為異常實驗點,不參與回歸直線擬合。

顯然,有多少對數(shù)據(jù),就有多少個殘差。殘差分析就是通過殘差所提供的信息,分析出數(shù)據(jù)的可靠性、周期性或其它干擾。

分析為了更深入地研究某一自變量與因變量的關(guān)系,人們還引進了偏殘差。此外, 還有學生化殘差、預(yù)測殘差等。以某種殘差為縱坐標,其它變量為橫坐標作散點圖,即殘差圖 ,它是殘差分析的重要方法之一。通常橫坐標的選擇有三種:

(1) 因變量的擬合值;

(2)自變量;

(3)當因變量的觀測值為一時間序列時,橫坐標可取觀測時間或觀測序號。

殘差圖的分布趨勢可以幫助判明所擬合的線性模型是否滿足有關(guān)假設(shè)。如殘差是否近似正態(tài)分布、是否方差齊次,變量間是否有其它非線性關(guān)系及是否還有重要自變量未進入模型等。.當判明有某種假設(shè)條件欠缺時, 進一步的問題就是加以校正或補救。需分析具體情況,探索合適的校正方案,如非線性處理,引入新自變量,或考察誤差是否有自相關(guān)性。