《第二章 概率與分布》由會員分享,可在線閱讀,更多相關(guān)《第二章 概率與分布(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第二章 概率與分布(345)(駱福添)
·聯(lián)系:
對象
在離散點或
區(qū)間上分布
分布特征數(shù)
樣本數(shù)據(jù)
頻數(shù)分布表
頻數(shù)分布圖
描述指標 () (p)
隨機變量
概率分布表
概率分布圖
總體參數(shù) () (p)
2。3 二項分布
一、概率函數(shù) (概率分布表)
·名詞解釋:觀察結(jié)果二項、概率等于二項展開式
·有放回地獨立重復(fù)摸球5次后黑球出現(xiàn)總次數(shù)X的概率函數(shù)。
fx 表2。1 例2。3中離散型隨機變量X的概率函數(shù)(n=5)
X的可
能取值
黑球數(shù)
0
1
2
3
4
5
概率P(x)
0。0003
0.0
2、064
0.0512
0.2048
0.4096
0.3277
·這個概率函數(shù)值恰好對應(yīng)于下列二項展開式的各個項:
?(0.2+0。8)5 =(0.2)5 +(0.8)(0.2)4 +(0.8)2 (0。2)3
?? +(0.8)3 (0.2)2 +(0.8)4 (0.2)+(0.8)5
·一般地,陽性概率為p,n次獨立、重復(fù)試驗后該事件出現(xiàn)陽性數(shù)為x次的概率為
, x=0, 1, , n (2。13)
其中
, 0!=1, k!=k(k-1)…(2)(1), k≠0
?。?。13)式稱為二項分布的概率函數(shù),稱相應(yīng)的隨機變量X服從二項分布(b
3、inomial distribution), 記為X~Β(p, n)
·至多出現(xiàn)x次數(shù)的概率為P=P(0)+P(1)+…+P(x),簡記為
??? (2。14)
這就是二項分布變量X的分布函數(shù).
例2.3 現(xiàn)有5只動物注射了半數(shù)致死量的毒物,試分別計算死亡動物數(shù)X=0, 1, 2, 3, 4, 5的概率。(提示:p=0.5)
解 P(0)=(0.5)5 (0.5)0 =0.03125
P(1)=(0.5)4 (0.5)1 =0.15625
P(2)=(0。5)3?。?.5)2 =0。31250
P(3)=(0.5)2 (0.5)3 =0.31
4、250
P(4)=(0.5)1(0.5)4 =0.15625
P(5)=(0.5)0 (0.5)5 =0。03125
二、分布圖形的特征 (概率分布圖)
圖2.1
·p〈0。5時, 在橫軸的正方向拖一長尾呈正偏峰(a)
·p>0.5時, 在橫軸的負方向拖一長尾呈負偏峰(b)
·p=0。5時, 呈對稱(c)
·n相當大,np和n(1-p)都大于5,p=?,圖形也接近對稱(d)
Pois
0
1
2
3
4
5
0
0.1
0.2
0.3
0.4
0.5
(a) p<0.50 (正偏峰)
0
1
2
4
5
0
0.
5、1
0.2
0.3
0.4
0.5
(b) p>0.50 (負偏峰)
圖2.1 若干二項分布的概率函數(shù)直條圖
13
0
1
2
3
4
5
6
7
8
9
10
11
12
0
0.1
0.2
0.3
0.4
(d) p10.50, n相當大 (對稱、正態(tài))
0
1
2
3
4
5
0
0.1
0.2
0.3
0.4
0.5
(c) p=0.50 (對稱)
三、總體均數(shù)與總體標準差
(平均水平與變異程度-分布參數(shù))
·推導(dǎo)過程:(下述黑體字公式,可忽略)
?=··= ?? (2。15)
=
6、(2。16)
(2。17)
?(2.18)
? ? ? (2。19)
? (2.20)
?=
?? == ?(2.21)
·樣本頻率的總體均數(shù)、總體方差和總體標準差
mx=np,??? mp=p?
? , ?(2。22)
??,?
四、實例討論(略)
第四節(jié) Poisson分布
一、概率函數(shù)
·Poisson分布是
(1)罕見的獨立事件陽性數(shù)目的隨機分布
(2)也可視為n很大, p很小時二項分布B(p, n)的極限情形
·以放射性脈沖計數(shù)為例,Poisson分布的前提條件:
(1) (n足夠大),區(qū)間足夠小,以致每
7、個區(qū)間陽性數(shù)<2(平穩(wěn)性)
(2) 每個區(qū)間陽性概率都是(重復(fù)、小概率)
(3) 不同區(qū)間是否發(fā)生是統(tǒng)計獨立的(獨立性)
數(shù)學(xué)上可以證明, 當n→∞時Pn(x)的極限為
?? ? (2.23)
·應(yīng)用:
?許多發(fā)病率很低的疾?。ㄈ缒[瘤,不具傳染性、無永久免疫、無遺傳性),發(fā)病人數(shù)X近似地服從Poisson分布,其中
二、分布圖形的特征
例2.4 據(jù)報導(dǎo), 新生兒染色體異常率為1%, 試用兩種方法計算100名新生兒發(fā)生x=0, 1, 2例染色體異常的概率。
解 利用二項分布和Poisson分布計算的結(jié)果如表2。2所示
表2。2 用二項分布和POISSON分布計算染
8、色體異常概率的比較
X
P(x)
Β(1%, 100)
Π(1)
0
(0。99)100 (0。01)0=0。3660
e—1 (1)0 /0?。?.3679
1
(0.99)100-1 (0。01)1=0.3697
e-1 (1)1 /1!=0。3679
2
(0。99)100-2 (0。01)2=0。1849
e-1 (1)2 /2!=0。1839
·Poisson分布圖形:
?呈正偏峰
不可能出現(xiàn)負偏峰的圖形 f2_3a
三、總體均數(shù)和總體方差
二項分布的總體均數(shù)和總體方差為
?? 和
Poisson分布的總體均數(shù)和總體方差為
9、 和
即總體均數(shù)等于總體方差。這是Poisson分布獨有的性質(zhì), 可通過考察樣本均數(shù)是否接近樣本方差, 來判斷是否為Poisson分布
四、可加性
設(shè)X1~Π(λ1 ), X2 ~Π(λ2), 且互相獨立,
? 則X1 +X2 ~Π(λ1 +λ2?。?
例如, 假定每10分鐘內(nèi)記錄到的放射性脈沖數(shù)服從Π(λ), 獨立、重復(fù)2次, 測定值為X1和X2 , 則它們之和服從Π(2λ).
·但須注意, 設(shè)X~Π(λ), 則2X并不服從Π(2λ), X/2也不服從Π(λ/2)。
例如, 10分鐘內(nèi)測定的放射性脈沖數(shù)乘2后并不等于20分鐘
10、內(nèi)的測定資料, 不能用Π(2λ)來描述; 10分鐘的測定值除以2后也不等于5分鐘內(nèi)的測定值, 也不能用Π(λ/2)來描述。
第五節(jié) 正態(tài)分布
一、概率密度函數(shù)
實踐中許多連續(xù)型隨機變量的頻率密度直方圖形狀是中間高、兩邊低、左右對稱的, 為便于研究相應(yīng)的總體規(guī)律, 人們用概率密度函數(shù)
? (2.24) f2_3
來描述這類隨機變量, 并稱這樣的變量服從正態(tài)分布(normal distribution) 或高斯分布(Gaussian distribution)。
正態(tài)分布有兩個參數(shù)μ和σ。μ是總體均數(shù);σ是總體標準差(永遠大于零)。這兩個參數(shù)可完全決定一個正態(tài)分布,
11、故常簡記為N(μ, σ2 )。當μ=0, σ=1時, 概率密度函數(shù)和分布函數(shù)分別為
密度函數(shù)
分布函數(shù) ?(2.25)
這樣的正態(tài)分布稱為標準正態(tài)分布, 簡記為N(0, 1)。
正態(tài)概率密度曲線圖性質(zhì):
(1) 關(guān)于對稱;
(2) 在處曲線最高;
(3) 在處各有一個拐點;
(4) 曲線下面積為1;
(5) 若固定, 隨值不同, 曲線位置不同, 故稱為位置參數(shù);
(6) 若固定, 大時, 曲線矮而胖;小時, 曲線瘦而高, 故稱為形狀參數(shù)。
m-2s m-s m m+s m+2s
-2 -1 0
12、 1 2
x
z
(a) (b)
圖2.3 正態(tài)概率密度圖 (a)一般形狀 (b)與m和s關(guān)系
m1 m2
s2
13、尾部面積a:
f2_3 表2.3 標準正態(tài)分布幾個重要的臨界值
雙側(cè)臨界值Za
單側(cè)尾部面積
雙側(cè)尾部面積
1.645
0。05
0.10
1。960
0.025
0。05
2.576
0。005
0.01
三、參考范圍的確定
方法:
·95%參考值范圍(95%CI)(錯誤概率a=0.05,把握度=0.95)
(―1.96s, +1.96s) 或
·99%參考值范圍(95%CI)(錯誤概率a=0.01,把握度=0。99)
??(―2.58s, +2.58s) 或
四、二項分布和Poisson分布的正態(tài)近似
1。 連續(xù)
14、性校正
離散型變量只能在0, 1, 2, …等正整數(shù)取值,為了借用連續(xù)型變量的分布函數(shù)來計算概率,首先要把概率函數(shù)“連續(xù)化”,把概率函數(shù)圖中的“直條”改造成“直方”
(a) 概率函數(shù)直條圖 (b) 連續(xù)性校正直方圖 (c) 正態(tài)近似圖
圖2.4 二項分布連續(xù)性校正和正態(tài)近似示意圖
表2.4 二項分布概率的連續(xù)性校正和正態(tài)近似
(1)
(2)
(3)
(4)
二項分布
概率
連續(xù)性校正后概率函數(shù)圖上長方形所在的區(qū)間
近似正態(tài)分布概
率密度圖上曲線
下圖形所在區(qū)間
概率近似公式:在相應(yīng)的
區(qū)間上,近似正態(tài)分布
15、概
率密度曲線下圖形的面積
P(X=k)
(k-0.5, k+0.5)
(k-0.5, k+0.5)
P(X≤k)
(0, k+0.5)
(—∞,?。?0.5)
P(X≥k)
(k-0。5, n)
(k-0。5, +∞)
P(≤X≤k2)
(k1—0。5, k2+0。5)
(k1—0.5, k2+0.5)
2。 正態(tài)近似 理論上可以證明
(1)二項分布X~B(p, n)
??X~N(np, np(1-p))
近似
并且
??P=X/n ~ N(p, p(1-p)/n)
(2)Poisson分布則
X ~ N(λ,
16、 λ)
例2.5 假定人群中某病患病概率為0.005, 現(xiàn)對該人群中的10000人體檢, 試求檢出人數(shù)不少于55人的概率。
解 可認為檢出人數(shù)服從二項分布
二項分布資料用Poisson分布近似與正態(tài)近似比較
直接計算
正態(tài)近似
相對誤差
二項分布
0。2572
0。2616
1。7%
Poisson分布
0。2577
0。2624
1。8%
相對誤差
0.2%
0.3%
計算過程:
? P(x≥55)==0.2572
或據(jù)Poisson分布,令參數(shù)λ=10000×0。005=50,
? P(x≥55)==0。2577
計算繁雜.現(xiàn)采用正態(tài)近似,
??np=50,np(1—p)=50×0。995=49。75
利用二項分布正態(tài)近似公式
? P(x≥55)=Φ
???=Φ==0.2616
利用Poisson分布的正態(tài)近似公式
? P(x≥55)≈Φ
??=Φ==0。2624
兩者與0。2572的相對誤差均小于2%.
★ 結(jié)語:
對象
在離散點或
區(qū)間上分布
分布特征數(shù)
樣本數(shù)據(jù)
頻數(shù)分布表
頻數(shù)分布圖
描述指標 () (p)
隨機變量
(誤差)
概率分布表
概率分布圖
總體參數(shù) () (p)
文中如有不足,請您見諒!
6 / 6