离散型随机变数.ppt
離散型隨機變數,隨機變數 離散型隨機變數的機率分布 期望值 二項分布 超幾何分布 卜瓦松分布,隨機變數,定義(隨機變數) 隨機變數(random variable)是一種函數對應,把樣本空間中每一個樣本點對應到一個數。,例: 連續擲一枚硬幣三次,令H代表正面、T代表反面,則樣本空間為 S =HHH, HHT, HTH, THH, HTT, THT, TTH, TTT,HHH3, HHT2, TTH1, TTT0 像這樣的一種函數對應,就叫做隨機變數。,如果我們關心的是擲三次所得到的正面總數,則樣本空間中每一個樣本點都會對應一個數字。,隨機變數類型,離散型隨機變數 選修課程修課人數 服務多少位顧客 可能值都是非負整數,非負整數0、1、2、當中的任兩個數之間都有間隔 連續型隨機變數 河川或水庫的可能水位 可能值會連起來,沒有間隔,因此不能用一個個單獨的值代表,而必須用區間表示,隨機變數,定義 若隨機變數的可能值是分散開的,叫做離散型隨機變數(discrete random variable); 若可能值是連起來的,必須用區間表示,叫做連續型隨機變數(continuous random variable)。,註: 離散型隨機變數會考慮單獨一點的機率 連續型隨機變數則只考慮落在區間的機率,因為任何單獨一點的機率都是0。,離散型隨機變數的機率分布,機率函數,定義(機率函數) 設X為離散型隨機變數,其機率函數(probability function, p.f.)或機率密度函數(probability density function, p.d.f.)定義為 p(x) =PX =x,註: 機率函數用在離散型隨機變數,機率密度函數用在連續型隨機變數。 通常機率質量函數(probability mass function, p.m.f.)用在離散型隨機變數。,離散型隨機變數的機率函數,離散型隨機變數的機率函數p(x)必滿足下列條件: 1. p(x)0對所有x成立。 2.,例4.2-1 連續擲一枚均勻硬幣三次,令X代表擲出之正面總數,試求X之機率分布。,解:,X之機率分布為,期望值與變異數,期望值,定義(期望值) 若離散型隨機變數X的機率函數為p(x),則X的期望值(expected value, expectation或mean)為,例4.3-1 (續例4.2-3)試求小胖實際需要付的金額(元)之期望值。,解:,期望值為86.25元的直觀意義大約為: 如果小胖重複消費許多次,每次都花費100元,抽獎之後可能有時要付70元,有時要付95元,但許多次的平均,會接近86.25元。,期望值,定義(期望值) 若離散型隨機變數X的機率函數為p(x),而g為一函數,則g(X)仍是離散型隨機變數,其期望值為,例4.3-3 設有一遊戲規則如下:參加者可擲一均勻硬幣三次,然後可獲得不同金額的獎金,獎金等於正面數的平方再加上1(以元為單位),而每玩一次要先繳4元。計算玩此項遊戲一次所得金額之期望值,以判斷此遊戲是否公平。,解:,X之機率分布為,X的線性函數之期望值,定理(X的線性函數之期望值) E(aX+b)=aE(X)+b,a,b為常數,以上所列公式可以推廣應用到更多項相加的情況,例如 E(aX2+bX+c)=aE(X2)+bE(X)+c,例4.3-4 (續例4.3-3)同樣的遊戲,如果獎金金額改為h(X)=2X2-3X+1,X代表正面總數,則玩此項遊戲一次所得金額的期望值是多少?,解:,變異數,定義(變異數) 隨機變數X的變異數(variance)為 2 =V(X) =E(X-)2 ,標準差(standard deviation)為 。,註: 2 =V(X) =E(X-)2=E(X2)- 2,例4.3-5 設X為離散型隨機變數,機率函數如下,試求X之變異數及標準差:,解:,X之期望值:,X的線性函數之變異數,定理(X的線性函數之變異數) V(aX+b)=a2V(X),例4.3-7 (續例4.3-5)設X為離散型隨機變數,機率函數如下,試求2X -3之變異數及標準差:,解:,變異數性質,因為(X-)20,所以變異數2 = E(X-)2的值必定是非負的。 若2 = E(X-)2=0,則代表X的值沒有任何分散的情況也就是,X等於常數,有人稱這種隨機變數叫做退化的隨機變數(degenerate random variable)。嚴格說來,這樣的X已不夠資格叫做隨機變數了,因為它的值永遠都一樣,毫無變化。,二項分布,二項分布,隨機變數X若符合以下描述,即稱為二項隨機變數(binomial random variable),其分布稱為二項分布(binomial distribution),參數為n及p,以符號XB(n,p)表示: 1. 同一隨機試驗重複做n次。 2. 每一次試驗的結果只有兩種可能:成功(S)或失敗(F)。 3. 每一次試驗的成功機率相同,用p代表。 4. 各次試驗之間相互獨立。 5. X等於n次試驗的成功總次數。 符合以上第1項到第4項描述的試驗,便叫做二項隨機試驗(binomial random experiment)。,伯努利試驗,二項式試驗若只做一次,叫做伯努利試驗(Bernoulli trial)。 若令X等於試驗的成功次數,則X的可能值只有0或1(結果得到成功,則X= 1,否則X=0),我們稱X為伯努利隨機變數,參數為p=P(X= 1)。,二項隨機變數可視為n項互相獨立、參數相同的伯努利隨機變數的和。,設X1,X2,Xn為互相獨立的伯努利隨機變數,p=P(Xi=1),則 的分布是參數為n、p之二項分布。,例4.4-1 盒子裡裝著1顆白球和2顆紅球。若從盒子中隨意取出一球,記錄顏色後放回,重複執行5次,則5次中紅球正好出現3次的機率是多少?,解:,二項分布的機率函數,若XB(n,p),則X的機率函數為,二項分布的應用,品管工程師會關心瑕疵品的比例是否過高 因為產品數量太大,通常只能抽驗 抽驗產品屬於取出不放回形式,前後結果之間不獨立 在產品總數量極大,抽出檢查的件數相對來說很小時,取出不放回和取出放回差別不大,可視為前後結果互相獨立 在此假設下,若從生產線上隨機抽出若干件產品來檢驗,則瑕疵品的總件數可視為符合二項分布 精品店關心的是來店的顧客是否有消費 經過長時間的紀錄,發現進店後有消費的顧客比例是p,則n位顧客中的消費人數,亦大致可視為參數為n及p的二項隨機變數。,例4.4-2 某次統計學小考,老師出了10題單選題,每題有4個選項。小翰完全沒讀書,每一題都是瞎猜,試求他(a)恰好答對5題的機率; (b)至少答對6題的機率。答案用式子表示即可,不須計算。,解:,期望值和變異數,若XB(n,p),則X之期望值和變異數公式為 E(X)=np V(X)=np(1-p),例4.4-5 每期統一發票收執聯末三位數號碼與頭獎中獎號碼末三位相同者,可得六獎,獎金200元。如果某期統一發票共開出三組頭獎號碼(三組的末三位號碼都不相同),阿邦和家人共蒐集了該期200張發票,則他們會中該期發票六獎的發票張數之期望值會是多少?,解:,若令X代表200張發票中,中6獎的張數,則X B(200, ),因此X的期望值等於,超幾何分布,超幾何分布,總共有N個物件、分成兩類,其中第一類有M件、第二類有N-M件,從N件中任意抽出n件,取出不放回,我們關心的是所抽出n件當中,第一類恰有x件的機率。若令X代表在上述架構下,所抽出n件中第一類的件數,X就叫做超幾何隨機變數,參數為N、M、n,其機率函數如下: 若X為參數N、M、n的超幾何隨機變數,則其機率函數為 x為非負整數 符號max(a, b),代表a, b中較大的數;符號min(a, b),則代表a, b中較小的數。,例4.5-1 容器中有3顆紅球、5顆白球,從中任取4顆,取出不放回。令X代表4顆中紅球的顆數,試寫出X的機率函數。,解:,期望值和變異數,若X為參數N、M、n的超幾何隨機變數,其期望值和變異數為,例4.5-3某選修課有15位同學修習,其中四年級4位、三年級11位。某次上課,老師以隨機抽座號的方式任意選出5位同學上台做報告。令X代表5位同學中的四年級同學人數,試求(a) X的機率函數; (b) X的期望值和變異數。,解:,超幾何分布與二項分布,當N很大、n卻很小時參數N、M、n的超幾何隨機分布,可以用參數為n和 的二項分布來逼近。,例4.5-4 某百貨公司週年慶時把2000件過季T恤放在花車用超低價促銷,其中有600件略有瑕疵。阿花很勇猛的隨便抓了10件,試求10件T恤中,瑕疵品不超過2件的機率。,解:,瑕疵品不超過2件的機率,P(X2)大約等於,卜瓦松分布,卜瓦松分布,一大張壁紙上的瑕疵數,某網站在某時段十分鐘之內的上網瀏覽人數,或者某路段一個月之內的車禍數,這些都屬於計次型的離散變數。雖然計次的對象不同,但這類變數常符合某些共同性質,且根據這些性質可以導出一族特定的分布,叫做卜瓦松分布(Poisson distribution),它有一個參數為特定範圍內的平均發生次數;此處範圍做廣義解釋,有可能是一段時間、或一個區域等等。,參數為的卜瓦松隨機變數X,其機率函數為 其中的e為實數,e= 2.71828。,例4.6-1 假設秘書張小姐所打的文件,平均每一頁有0.5個錯。某天,她替上司打了一份12頁的報告。假設錯誤數X符合卜瓦松分布,試求該份報告當中(a)恰好有2個錯的機率;(b)至少有4個錯的機率;(c)完全沒有錯誤的機率。,解:,期望值和變異數,若X為參數的卜瓦松隨機變數、則其期望值和變異數為 E(X)= V(X)=,例4.6-2 假設某眼科診所在上班日白天(早上9點到下午5點)的求診人數符合卜瓦松分布,平均每小時3位病人。令X代表某個上班日從10:00到11:12的求診人數,求(a)X的期望值和變異數(b)P(X3),解:,(a)從10:00到11:12中間有一小時12分鐘,也就是1.2小時,所以這段時間的平均求診人數是 =31.2=3.6 X的期望值和變異數都等於3.6。,(b) P(X3)= 1-P(X2)=1-0.3027=0.6973,二項分布與卜瓦松分布,當n較大、p卻很小時,,n較大、p很小並沒有一定的標準。 一般來說,n至少應該要滿足n20,且p的大小和n的大小也有關係;n若不夠大,p應該要小些,n若較大,則p不需太小即可。 有教科書就如此建議:若n20且p0.05時,或若n100且p0.10時,適合用卜瓦松分布來逼近二項分布。,例4.6-3 某製造商生產的聖誕樹裝飾用彩色小燈泡中,有3%屬於瑕疵品。現從商店買一盒該廠生產的小燈泡100個,則其中所包含的瑕疵品個數符合參數n=100、p= 0.03的二項分布。利用卜瓦松分布來求100個小燈泡中,瑕疵品不超過4個的機率。,解:,令X代表100個小燈泡中,瑕疵品的個數,則題目所求為P(X4)。,直接用二項分布求機率,必須計算下式,改用卜瓦松分布來逼近,參數為=np=100(0.03)=3,則可得近似機率,