基本介紹
混合線性模型是20世紀80年代初針對統(tǒng)計資料的非獨立性而發(fā)展起來的。由于該模型的理論起源較多,根據(jù)所從事的領(lǐng)域、模型用途,又可稱為多****水平模型(Multilevel,MLM)、隨機系數(shù)模型(Random Coefficients,RCM)、等級線性模型(Hierarchical Linear,HLM)等。甚至和廣義估計方程也有很大的交叉。這種模型充分考慮到數(shù)據(jù)聚集性的問題,可以在數(shù)據(jù)存在聚集性的時候?qū)τ绊懸蛩剡M行正確的估計和假設(shè)檢驗。不僅如此,它還可以對變異的影響因素加以分析,即哪些因素導(dǎo)致了數(shù)據(jù)間聚集性的出現(xiàn),哪些又會導(dǎo)致個體間變異增大。由于該模型成功地解決了長期困擾統(tǒng)計學(xué)界的數(shù)據(jù)聚集性問題,20年來已經(jīng)得到了飛速的發(fā)展,也成為SPSS等權(quán)威統(tǒng)計軟件的標準統(tǒng)計分析方法之一2。
在傳統(tǒng)的線性模型(y=xb+e)中,除X與Y之間的線性關(guān)系外,對反應(yīng)變量Y還有三個假定:①正態(tài)性,即Y來自正態(tài)分布總體;②獨立性,Y的不同觀察值之間的相關(guān)系數(shù)為零;③方差齊性,各Y值的方差相等。但在實際研究中,經(jīng)常會遇到一些資料,它們并不能完全滿足上述三個條件。例如,當(dāng)Y為分類反應(yīng)變量時,如性別分為男、女,婚姻狀態(tài)為已婚、未婚,學(xué)生成績是及格、不及格等,不能滿足條件①。當(dāng)Y具有群體特性時,如在抽樣調(diào)查中,被調(diào)查者會來自不同的城市、不同的學(xué)校,這就形成一個層次結(jié)構(gòu),高層為城市、中層為學(xué)校、低層為學(xué)生。顯然,同一城市或同一學(xué)校的學(xué)生各方面的特征應(yīng)當(dāng)更加相似。也就是基本的觀察單位聚集在更高層次的不同單位中,如同一城市的學(xué)生數(shù)據(jù)具有相關(guān)性,不能滿足條件②。當(dāng)自變量X具有隨機誤差時,這種誤差會傳遞給Y,使得Y不能滿足條件③。
如果對不滿足正態(tài)性、獨立性、方差齊性三個適用條件的資料采用傳統(tǒng)的分析方法,對所有樣本一視同仁,建立回歸方程,就會帶來如下問題:
(1)參數(shù)估計值不再具有最小方差線性無偏性。
(2)會嚴重低估回歸系數(shù)的標準誤差。
(3)容易導(dǎo)致估計值過高,使常用的檢驗失效,從而增加統(tǒng)計檢驗I型錯誤發(fā)生的概率。
如果我們對不同的群體分別建立各自的回歸模型,當(dāng)群體數(shù)較少,群體內(nèi)樣本容量較大,傳統(tǒng)的分析方法可能是有效的。或者,我們的興趣僅在于對這些群體分別做一些統(tǒng)計推斷時,也適合用這種方法。但是如果我們把這些群體看成是從總體中抽樣來的一個樣本(例如多階段抽樣和重復(fù)測度數(shù)據(jù)),并想分析不同群體之間的總體差異,那么簡單地使用傳統(tǒng)的統(tǒng)計方法是不夠的。同樣,如果一些群體包含的樣本容量較少,對這些群體做出的推斷也不可靠。因此,我們需要把這些群體看成是從總體抽樣來的樣本,并使用樣本總體的信息來進行推斷3。
本文所討論的混合線性模型既保留了傳統(tǒng)線性模型中的正態(tài)性假定條件,又對獨立性和方差齊性不作要求,從而擴大了傳統(tǒng)線性模型的適用范圍3。
混合線性模型的結(jié)構(gòu)具有固定效應(yīng)的一般線性模型的結(jié)構(gòu)為:
式中的Y表示反應(yīng)變量的測量值向量,X為固定效應(yīng)自變量的設(shè)計矩陣,
是與X對應(yīng)的固定效應(yīng)參數(shù)向量,
為剩余誤差向量。
為在X條件下的Y的平均值向量,即
。
假定為獨立、等方差及均值為0的正態(tài)分布,即
用最小二乘法求參數(shù)
的估計值B。
混合線性模型將一般線性模型擴展為:
式中Z為隨機效應(yīng)變量構(gòu)造的設(shè)計矩陣,其構(gòu)成方式與X相同。
為隨機效應(yīng)參數(shù)向量,服從均值向量為0、方差協(xié)方差矩陣為G的正態(tài)分布,表示為
。
為隨機誤差向量,放寬了對
的限制條件,其元素不必為獨立同分布,即對E沒有
及
的假定。用符號表示隨機誤差向量
,不要求
的方差、協(xié)方差矩陣R的主對角元素為
、非主對角元素為0。同時假定Cov(G,R)=0,即G與R間無相關(guān)關(guān)系。這時Y的方差、協(xié)方差矩陣變?yōu)椋?/p>
Y的期望值為:
當(dāng)
時,混合線形模型轉(zhuǎn)變?yōu)橐话憔€形模型3。