二項分布(Binomial distribution)
二項分布是一種具有廣泛用處的散伙型隨機變量的概率分布,它是由貝努里始創的,以是又叫貝努里分布。
二項分布是指統計變量中僅有實質不同的兩項群體的概率分布。所謂兩項群體是按兩種不同實質區分的統計變量,是二項實驗的后果。即各個變量都可歸為兩個不同實質中的一個,兩個觀察值是對峙的。因此兩項分布又可說是兩個對峙事變的概率分布。
二項分布的剖析
二項分布用標記b(x.n.p),表現在n次實驗中有x次告捷,告捷的概率為p。
二項分布的概率函數可寫作:
式中x=0、1、2、3.....n為正整數
兩項分布中含有兩個參數n與p,當它們的值已知時,便可盤算出分布列中各概率的值。
例1 擲硬幣實驗。有10個硬幣擲一次,或1個硬幣擲十次。問五次正面向上的概率是幾多?
解:依據題意n=10,p=q=1/2,x=5
以是五次正面向上的概率為0.24609
此題若問五次及五次以上正面向上的概率是幾多?
解:此題要求出五次及五次以上正面向上的概率之和。正面有五次、六次、七次、八次、九次、十次。依公式5—9應為:
C105p5q10?5 + C106p6q10?4 + C107p7q3 + C108p8q2 + C109p9q1 + C1010p10q0
= 252/1024+210/1024+120/1024+45/1024+10/1024+1/1024
= 638/1024
= 0.623
五次及五次以上正面向上的概率為0.623
此題各項掀開式的系數,若用楊輝三角盤算也十分便利。讀者:前方的楊輝三角寫到(p + q)10。試比力五次及五次以—LK面向;的各項系數對否為252、210、120、45、10、1。
二項分布的實質
(一)二項分布是散伙型分布,概坦白方圖是躍階式的。由于x為不一連變量,用概率條圖表現更切合,用直方圖表現只是為了更外貌些。
1.當p=q時圖形是對稱的
例2 (p + q)6,p=q=1/2,各項的概率可寫作:
p6 + 6p5q + 15p4q2 + 20p3q3 + 15p2q4 + 6plq5 + q6
= 1/64+6/64+15/64+20/64+15/64+6/64+1/64
= 1
2.當p≠q時,直方圖呈偏態,p<q與p>q的偏斜朝向相反。假如n很大,即使p≠q,偏態漸漸低落,終極成正態分布,二項分布的極限分布為正態分布。故當n很大時,二項分布的概率可用正態分布的概率作為近似值。何謂n很大呢?平常劃定:當p<q且np≥5,或p>q且nq≥5,這時的n就被以為很大,可以用正態分布的概率作為近似值了。
(二)二項分布的均勻數與標準差
假如二項散充滿意p<q,np≥5,(或p>q,np≥5)時,二項分布接近正態分布。這時,也僅僅在這時,二項分布的x變量(即告捷的次數)具有如下實質:
μ = np (5—10a)
(5—10b)
即x變量具有μ = np ,
的正態分布。
式中n為獨立實驗的次數,
p為告捷事變的概率,q=1- p。 由于n很大時二項分布迫近正態分布,其均勻數,標準差是依據實際推導而來的,故用μ和σ而不必X和S表現。它們的含義是指在二項實驗中,告捷的次數的均勻數μ = np ,告捷次數的疏散程
。比如一個擲10枚硬幣的實驗,顯現正面向上的均勻次數為5次(μ= np=
),正面向上的分布水平為10×(1/2)×(1/2)= 1.58(次),這是依據實際的盤算,而在實踐實驗中,有的人可得10個正面向上,有人得9個、8個……,人數越多,正面向上的均勻數越接近5,疏散水平越接近1.58。
二項分布的使用條件
1.各察看單位只能具有互相對峙的一種后果,如陽性或陰性,活著或殞命等,屬于兩分類材料。
2.已知產生某一后果(陽性)的概率為π,其對峙后果的概率為1-π,實踐事情中要求π是從多量察看中取得比力安定的數值。
3.n次實驗在相反條件下舉行,且各個察看單位的察看后果互相獨立,即每個察看單位的察看后果不會影響到其他察看單位的后果。如要求疾病無影響性、無家屬性等。
二項分布的使用
項分布在心思與教導研討中,主要用于處理含天然遇實質的成績。所謂機會成績,即指在實行或觀察中,實行后果約莫是由 ?推測而形成的。好比,選擇標題標回復,劃對劃錯,約莫完全由推測形成。凡此類成績,欲區分由推測而形成的后果與真實的后果之間的界線,就要使用二項分布來處理。
例3有正誤題10題,問答題者答對幾題才干以為他是真會,大概說答對幾題,才干以為不是出于推測要素?
此題p=q=1/2,即猜對猜錯的概率各為0.5。np≥5,故此二項分布接近正態分布:
依據正態分布概率,當Z=1.645時,該點以下包含了全體的95%。假如用原分數表現,則為
它的意義是,完全憑推測,10題中猜對8題以下的約莫性為95%,猜對8、9、10題的概率只5%。因此可以推論說,答對8題以上者不是憑推測,而是會答。但應該明白:作此結論,也仍舊有出錯誤的約莫,即那些完全憑推測的人也有5%的約莫性答對8、9、10道題。
此題的概率值,還可用二項分布函數直接盤算,亦得與正態分布近似的后果:
依據概率加法,答對8題及其以上的總概率為:45/1024+10/1024+1/1024=56/1024 = 0.0547 同理,可盤算8題以下的概率為 95%。(近似).
例4有10道多重選擇題,每題有5個答案,此中僅有一個是準確的。問答對幾題才干說不是猜的后果?
此題n=10,p=1/5 = 0.2,q = 0.8,np<5,故此題不接近正態分布,不克不及用正態分布盤算概率,而應直接用二項分布函數盤算猜時各題數的概率:
依據以上所盤算的猜對各題數的概率,可用概率加法求得猜對5題及5題以上的概率為0.03279,不敷5%,故可推論說答對5題以上者可算真會,作此結論仍有3.3%出錯誤的約莫。
若上例中題數增長到30題,則np>5,就可用正態分布的概率盤算:
因此可得結論,答對10題或10題以上,才干被以為是真會。作此結論出錯誤的概率為5%。
假如想使推論出錯誤的概率降為1%,則依據正態分布可求得此時的z=2.33,使用相反的盤算辦法,只將2.33代替1.645,可求得臨界的分數(或答對的題數)。
文章已取得作者受權
數據分析網(www.afenxi.com),國內搶先的大數據流派,旨在協助大數據從業人士、喜好者提供大數據訊息資訊、前沿武藝、業界看法的信息平臺。
版權聲明:本文來自互聯網整理發布,如有侵權,聯系刪除
原文鏈接:http://www.freetextsend.comhttp://www.freetextsend.com/wangluozixun/31721.html