版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-重尾分布

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

簡(jiǎn)介

重尾分布又可以分為兩個(gè)子類型,分別是長(zhǎng)尾分布(long-tailed distributions)以及次指數(shù)分布(subexponential distributions)。

定義在一個(gè)累積分布函數(shù)中,一個(gè)隨機(jī)變量X 的分布狀況,在以下?tīng)顩r時(shí),被稱為是一個(gè)重尾分布。假設(shè):

如果以尾部分布函數(shù)的方式來(lái)呈現(xiàn)時(shí),

最后可以被寫(xiě)成:

這相當(dāng)于一個(gè)動(dòng)差生成函數(shù), ,對(duì)所有的t>0 來(lái)說(shuō),都是無(wú)限的。重尾分布的左尾,與雙尾分布,定義相同1。

解釋重尾分布意味著可以更大的概率獲得很大的值. 因此與弱隨機(jī)性相反,重尾分布一般表示病態(tài),增加的各種結(jié)果被確定為具有重尾分布,包括收入分布、財(cái)務(wù)報(bào)告、保險(xiǎn)支出、網(wǎng)頁(yè)的參考鏈接等。重尾分布的一個(gè)特殊的子集是冪律,其意味著概率密度函數(shù)是一個(gè)冪。 一個(gè)技術(shù)難題是,不是所有的矩存在于這些分布,這一般意味著它們使用分位數(shù)和其它順序統(tǒng)計(jì)學(xué)。這也就是說(shuō),中心極限定理不再成立。但是對(duì)于諸如均值,即穩(wěn)定分布的線性組合,我們獲得一個(gè)新的標(biāo)準(zhǔn)極限分布。

設(shè)X是一個(gè)隨機(jī)變量, 為它的分布函數(shù),如果當(dāng) 時(shí) 稱X的分布為重尾分布,又稱冪律分布。

一般來(lái)說(shuō),服從重尾分布的隨機(jī)變量X具有較大甚至是無(wú)窮大的方差,而且當(dāng) 時(shí),X的均值也是無(wú)窮的。隨機(jī)變量X會(huì)以不可忽略的概率取到非常大的數(shù)值,即:大量的小抽樣取值和少量的大抽樣取值并存。

分類1.長(zhǎng)尾分布在一個(gè)累積分布函數(shù)中,一個(gè)隨機(jī)變量X的分布,出現(xiàn)以下?tīng)顩r時(shí),被稱為是一個(gè)長(zhǎng)尾分布。假設(shè)對(duì)所有t>0 :

這相等于

對(duì)一個(gè)右尾部形成長(zhǎng)尾分布的狀況,我們可以做一個(gè)直觀的解釋:假如一個(gè)長(zhǎng)尾分布的尾部數(shù)量超過(guò)某個(gè)很高的水準(zhǔn),它超過(guò)另一個(gè)更高水準(zhǔn)的機(jī)率會(huì)接近于一。也就是說(shuō),如果你發(fā)現(xiàn)狀況很糟,它可能會(huì)比你想像的還要糟。

長(zhǎng)尾分布是重尾分布中的一個(gè)特例。所有的長(zhǎng)尾分布都是重尾分布,但反之則不然,也就是說(shuō),我們可以找出某一個(gè)重尾分布,它不是長(zhǎng)尾分布。

次指數(shù)分布次指數(shù)分布是以概率分布的折積定義出來(lái)的。兩個(gè)獨(dú)立、不同的隨機(jī)變數(shù)的共同分布函數(shù) ,它自己的折積定義為,使用勒貝格-史臺(tái)杰斯積分(Lebesgue–Stieltjes integration) 定義為:

n-fold折積的 也以同樣方式定義。其尾端分布函數(shù)定義為{。

當(dāng)以下式子成立,概率分布函數(shù)在正的中線上,被定義為次指數(shù)分布

這也意味著,對(duì)所有來(lái)說(shuō):