版權歸原作者所有,如有侵權,請聯(lián)系我們

[科普中國]-隨機化回答

科學百科
原創(chuàng)
科學百科為用戶提供權威科普內容,打造知識科普陣地
收藏

在調查中當一個問題是敏感性的或高度私人機密性的(例如問被調查者是否曾冒充顧客進商店行竊或是否吸毒),則就會發(fā)生拒絕回答或回避回答的情況。

為了獲得對這類問題總體比例進行估計的資料,就需要采用隨機化回答技術。1

起源有時要對一些非常敏感的問題進行調查,比如“你服用可卡因嗎?”“你曾在商店里偷過東西嗎?”或者“你在納稅時低報了你的收入嗎?”等等。

預計那些應該回答“是”的人都有可能會撒謊,需要設計出鼓勵人們提供真實回答而又不致于尷尬的問題形式。Horvitz等(1967)對Warner(1965)最初提出的理念進行了修改,建議使用兩個問題——一個敏感性問題和一個無關緊要的問題——并由隨機化裝囂(如拋硬幣)來決定受訪者回答哪個問題。如果將拋硬幣作為隨機化裝置,當硬幣正面朝上時,受訪者需按指示回答“上周你吸食過可卡因嗎?”如果硬幣背面朝上,則受訪者按指示回答“你手表上的秒針在0到30之間嗎?”訪問員并不知道硬幣是正面朝上還是背面朝上,因此也不知道受訪者回答的是哪個問題。利用隨機化裝置以及讓受訪者事先了解訪問員不會知道他回答的是哪個問題,希望這兩點可以鼓勵受訪者對上周是否曾服用可卡因作出真實回答。

隨機化裝置可以采用各種方式,但必須事先知道人們被問及敏感問題的概率P以及被問及無關問題的概率1-P。Fox和Tracy(1986)介紹了其他的隨機化回答形式。 2

特征在社會經(jīng)濟的調查中有時會涉及一些敏感性問題。例如,市場工商管理部門要了解個體戶漏稅的比例有多大;計劃生育部門要了解在已婚的育齡婦女中有多少人采取了避孕措施;公安部門要了解吸毒者人數(shù)的比例,等等。對于這類的問題,容易引起被調查者的反感,他們或者不提供真實的情況,或者直接拒絕回答,從而使調查失敗。一般而言,調查中應盡量避免這類問題,以保證調查數(shù)據(jù)的質量。但有時,研究的題目就是這類敏感性問
題.在調查中無法回避。

它的基本特征是被調查者對所調查的問題采取隨機回答的方式,調查人員無法從被調查者的回答中得知對方是否具有某種特征。這樣,就可以在一定程度上消除被調查者的擔心和顧慮,使他們參與調查。并提供真實情況。另一方面,調查人員通過對所有調查結果的匯總。利用概率原理進行推算,又可以得到總體中具有該特征人數(shù)比例的估計值,從而實現(xiàn)調查的目的。因而,隨機化回答技術被認為是對敏感性問題進行調查,并對總體的特征比例進行數(shù)量推算的有效方法。

從理論上講,隨機化回答技術既可以用于訪問調查,也可以用于郵寄問卷等其他方式的調查。但是,隨機化回答問卷的設計比其他一般性調查問卷的設計要復雜。例如,在郵寄問卷調查中,被調查者很可能因為看不懂問卷而不知如何回答,在訪問調查中,調查人員可以詳細地向被調查者說明隨機化回答技術的原理,并講解如何回答這種類型的問卷,必要時還可以進行示范,幫助被調查者理解和掌握。所以,與其他調查方法相比,訪問調查在使用隨機化回答技術方面有更多的便利條件。3

混合效應隨機化回答模型傳統(tǒng)的隨機化回答技術都是針對單變量數(shù)據(jù)的,其主要目的是為了獲得具有敏感特性回答的概率估計。在Warner (1965)和Greenberg等(1969)的文獻中已經(jīng)詳細探討了關于估計的理論。然而,被調查者的輔助信息卻在一些情況下格外有用,以至于可以將其與肯定回答相聯(lián)系。Maddala( 1983)以及Scheers和Dayton (1988)便將這些帶有輔助信息的解釋變量納入隨機化回答模型中。其優(yōu)點在于可以減少標準誤差,并可以確立協(xié)變量信息與敏感特性的總體概率之間關系。

傳統(tǒng)的隨機化回答模型的另一個主要缺點是只能獲得與總體水平有關的結論——總體概率的估計和相關置信區(qū)間。這與當時僅對單變量數(shù)據(jù)進行相關與無關隨機化回答方法的發(fā)展目的一致,但卻不能滿足于調查者對單位水平參數(shù)的研究,這也導致無法對一些產(chǎn)生敏感特性的原因進行剖析。4

注意事項對敏感性問題采用隨機化回答技術的主要目的是為了消除被調查者的顧慮使其愿意配合,并對所抽到的問題給予正確的回答。在具體設計與操作上應注意以下幾個問題:

1.要使被調查者充分理解這種方法的特點,特別是一定;要讓被調查者明白,他究竟回答的是哪一個問題,別人是不知道的,因此在正式抽取并回答問題前,要讓被調查者作幾次試驗,例如請他反復從容器中抽取球,使他確信其中有不同顏色的球。當然隨機化裝置可以不一樣,也可用卡片等其他形式,但愈簡單愈好。

2.所提問題必須簡單明了,防止有不同的理解。例如我國在某些地區(qū)(特別是農(nóng)村)也采用農(nóng)歷,因此對“你是否出生在五月”這類問題若要采用,事先應明確是公歷。對涉及問題的解釋必須在抽問題以前進行,抽取問題后再詢問就暴露了抽到的是哪一個問題,也就失去了隨機化回答的意義。

3.在應用西蒙斯模型時,無關問題的選擇特別重要。一定要隱蔽性強的,即調查人無從猜測被調查人對該問題回答的答案。例如“你的身份證末位數(shù)是不是奇數(shù)”這類問題,由于我國居民身份證設計時,末位數(shù)的奇偶表示性別。并不是隨機的,而采用隨機化回答技術由于需要當面解釋,被調查人的性別不可能保密,這樣也就失去了無關問題奉來應具有的保護作用。5

本詞條內容貢獻者為:

杜強 - 高級工程師 - 中國科學院工程熱物理研究所