定義
p值是指在一個概率模型中,統(tǒng)計摘要(如兩組樣本均值差)與實際觀測數(shù)據(jù)相同,或甚至更大這一事件發(fā)生的概率。換言之,是檢驗假設(shè)零假設(shè)成立或表現(xiàn)更嚴(yán)重的可能性。p值若與選定顯著性水平(0.05或0.01)相比更小,則零假設(shè)會被否定而不可接受。然而這并不直接表明原假設(shè)正確。p值是一個服從正態(tài)分布的隨機(jī)變量,在實際使用中因樣本等各種因素存在不確定性。產(chǎn)生的結(jié)果可能會帶來爭議。1
意義
發(fā)展史R·A·Fisher(1890-1962)作為一代假設(shè)檢驗理論的創(chuàng)立者,在假設(shè)檢驗中首先提出P值的概念。他認(rèn)為假設(shè)檢驗是一種程序,研究人員依照這一程序可以對某一總體參數(shù)形成一種判斷。也就是說,他認(rèn)為假設(shè)檢驗是數(shù)據(jù)分析的一種形式,是人們在研究中加入的主觀信息。(當(dāng)時這一觀點(diǎn)遭到了Neyman-Pearson的反對,他們認(rèn)為假設(shè)檢驗是一種方法,決策者在不確定的條件下進(jìn)行運(yùn)作,利用這一方法可以在兩種可能中作出明確的選擇,而同時又要控制錯誤發(fā)生的概率。這兩種方法進(jìn)行長期且痛苦的論戰(zhàn)。雖然Fisher的這一觀點(diǎn)同樣也遭到了現(xiàn)代統(tǒng)計學(xué)家的反對,但是他對現(xiàn)代假設(shè)檢驗的發(fā)展作出了巨大的貢獻(xiàn)。)
Fisher的具體做法是:
假定某一參數(shù)的取值。
選擇一個檢驗統(tǒng)計量(例如z 統(tǒng)計量或Z 統(tǒng)計量) ,該統(tǒng)計量的分布在假定的參數(shù)取值為真時應(yīng)該是完全已知的。
從研究總體中抽取一個隨機(jī)樣本計算檢驗統(tǒng)計量的值計算概率P值或者說觀測的顯著水平,即在假設(shè)為真時的前提下,檢驗統(tǒng)計量大于或等于實際觀測值的概率。2
如果P