樣本方差為什么除n-1 概率的數(shù)學(xué)期望和方差
方差與樣本方差的區(qū)別?為什么方差是除以N,樣本方差是除以N-1?方差為什是是除以(n-1)而不是除以n啊,樣本方差為什么是n-1分之一?概率統(tǒng)計(jì)中計(jì)算樣本的方差,為什么除以n-1而不是除以n?樣本方差為什么除以n-1?
本文導(dǎo)航
樣本的方差和總體的方差的關(guān)系
1.研究某隨機(jī)變量的方差,有無(wú)窮多個(gè)樣本,可以通過(guò)抽取一個(gè)樣本集,以它的方差作為該隨機(jī)變量方差的估計(jì)。
當(dāng)該樣本集的樣本數(shù)N趨于正無(wú)窮時(shí),可以證明除以N-1才是無(wú)偏的,即收斂于該隨機(jī)變量的方差;除以N是有偏的。
因此采用無(wú)偏估計(jì)時(shí)除以N-1,而不是除以N。
2.僅研究某樣本集內(nèi)樣本數(shù)據(jù)的分散情況,除以N即可,這是方差原始的定義。
和差的n次方公式
這是為了達(dá)到對(duì)總體方差的無(wú)偏估計(jì)。你可以計(jì)算下樣本方差的期望值:
這樣,當(dāng)樣本數(shù)量足夠多時(shí),樣本方差就可以逼近總體方差(因?yàn)槠淦谕强傮w方差)。也就是說(shuō)達(dá)到了總體方差的無(wú)偏估計(jì)。
【要分清樣本方差和總體方差的區(qū)別】
樣本方差是固定的嗎
為什么樣本方差的分母為n-1而不是n?
樣本方差與樣本均值,都是隨機(jī)變量,都有自己的分布,也都可能有自己的期望與方差(由此進(jìn)一步討論估計(jì)量的無(wú)偏性與有效性)。取分母n-1,可使樣本方差的期望等于總體方差,即這種定義的樣本方差是總體方差的無(wú)偏估計(jì)。
這樣看,x1,x2,...xn是n個(gè)可以自由變化的樣本,互不影響。
而x1-xbar, x2-xbar,...xn-xbar是否也是n個(gè)自由變化的呢?不是……因?yàn)檫@n個(gè)統(tǒng)計(jì)量受到一個(gè)約束條件的影響就是之和等于0。如果我們記 yi=xi-xbar,也就是說(shuō)y1+y2+...yn=0,這樣我們可以任意變動(dòng)其中n-1值,比如取定了y1,y2,...y(n-1),那么yn就不能任意變化,yn=-(y1+y2+y(n-1))。
這個(gè)只是從自由變化的角度直觀解釋,實(shí)際上證明分布比較煩瑣……
舉個(gè)例子:
比如說(shuō)讓十跟人任意取十個(gè)數(shù),很容易理解可以隨便取.十個(gè)都是自由的.
如果我加一個(gè)條件,十個(gè)人取十個(gè)數(shù),但是這是個(gè)書加起來(lái)必須得零.第一個(gè)人可以隨便取,第二個(gè)人也可以,第九個(gè)也可以,都是自由的,但是第十個(gè)人不能隨便自由取,只能取特定的數(shù),才能保證這十個(gè)數(shù)的和是零.所以加了一個(gè)條件就丟了一個(gè)自由度
由于有一個(gè)約束條件,所以最后一個(gè)變量不能隨便取。為了滿足這個(gè)約束條件,第n個(gè)變量不能隨機(jī)取值,它的值由前n-1個(gè)變量確定了。問(wèn)題是:雖然第n個(gè)變量不能隨機(jī)取,假設(shè)取10以滿足約束條件,但10與均值的離差仍然存在。分子中,包括了這個(gè)離差平方,但分母卻不考慮它。
是不是可以這樣理解:按照方差的“定義”,分母仍應(yīng)取n。只是為了保證無(wú)偏性,對(duì)樣本方差進(jìn)行調(diào)整。通過(guò)計(jì)算,分母應(yīng)當(dāng)取n-1。這時(shí)的方差實(shí)際是“調(diào)整后的樣本方差”,只不過(guò)我們?nèi)詫⑺凶觥皹颖痉讲睢薄?/p>
用樣本去估計(jì)總體,當(dāng)然就要評(píng)估估計(jì)的好壞如何。第一個(gè)評(píng)估方面就是先要評(píng)估這個(gè)估計(jì)是有偏估計(jì)還是無(wú)偏估計(jì),無(wú)偏估計(jì)更為有效。除以n所得到的樣本方差雖然也是總體方差的估計(jì)量,但是不是無(wú)偏估計(jì)量,而除以n-1所得到的樣本標(biāo)準(zhǔn)方差則是無(wú)偏估計(jì)量。正因?yàn)槌詎-1所得到的樣本標(biāo)準(zhǔn)方差是總體的無(wú)偏估計(jì),所以它更科學(xué)點(diǎn),誤差小些。之所以選擇n-1,不是巧合,而是數(shù)學(xué)推導(dǎo)下的結(jié)果。
摘自ITPUB bestsong的博文:為什么樣本方差的分母為n-1而不是n?
概率的數(shù)學(xué)期望和方差
因?yàn)椴皇浅詎。
n-1時(shí),和總體方差一樣,是總體方差的無(wú)偏估計(jì)。
樣本方差先求出總體各單位變量值與其算術(shù)平均數(shù)的離差的平方,然后再對(duì)此變量取平均數(shù),就叫做樣本方差。樣本方差用來(lái)表示一列數(shù)的變異程度。樣本均值又叫樣本均數(shù)。即為樣本的均值。
在許多實(shí)際情況下,人口的真實(shí)差異事先是不知道的,必須以某種方式計(jì)算。 當(dāng)處理非常大的人口時(shí),不可能對(duì)人口中的每個(gè)物體進(jìn)行計(jì)數(shù),因此必須對(duì)人口樣本進(jìn)行計(jì)算。樣本方差也可以應(yīng)用于從該分布的樣本的連續(xù)分布的方差的估計(jì)。
擴(kuò)展資料:
n-1的使用稱為貝塞爾校正,也用于樣本協(xié)方差和樣本標(biāo)準(zhǔn)偏差(方差平方根)。 平方根是一個(gè)凹函數(shù),因此引入負(fù)偏差(由Jensen不等式),這取決于分布,因此校正樣本標(biāo)準(zhǔn)偏差(使用貝塞爾校正)有偏差。
標(biāo)準(zhǔn)偏差的無(wú)偏估計(jì)是一個(gè)技術(shù)上涉及的問(wèn)題,盡管對(duì)于使用術(shù)語(yǔ)n-1.5的正態(tài)分布,形成無(wú)偏估計(jì)。無(wú)偏樣本方差是函數(shù)?(y1,y2)=(y1-y2)2/2的U統(tǒng)計(jì)量,這意味著它是通過(guò)對(duì)群體的兩個(gè)樣本統(tǒng)計(jì)平均得到的。
參考資料來(lái)源:百度百科——樣本方差
方差為什么要除以n減1
自由度的問(wèn)題。在n個(gè)中隨機(jī)選,選了n-1個(gè),剩下的一個(gè)是確定的了,不能再選。所以除n-1,小生才疏學(xué)淺,還望拋磚引玉。嘿嘿,我們認(rèn)識(shí)不誒,mai生人
掃描二維碼推送至手機(jī)訪問(wèn)。
版權(quán)聲明:本文由尚恩教育網(wǎng)發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。