概率论基础第二章条件概率与统计独立性.ppt
《概率论基础第二章条件概率与统计独立性.ppt》由会员分享,可在线阅读,更多相关《概率论基础第二章条件概率与统计独立性.ppt(169页珍藏版)》请在三一文库上搜索。
1、第二章 条件概率与统计独立性,萨特,法国思想家、作家, 存在主义哲学的大师: “ Hell is other people ” 他人即地狱 对“我”来说,其他的人就像一个贼,要将“我”的世界偷去,将我纳入他们的轨道中,成为一个“在己存有”(being-in-itself ),成为一个对象或东西。,What should I do? Should I be who you want me to be? Just do it!,在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.,一、 条件概率的概念,如在事件B发生的条件下求事件A发生的概率,将此概率记作P(A|B).,一般地
2、P(A|B) P(A),1. 条件概率, 全概率公式,贝叶斯公式,P(A )=1/6,,例如,掷一颗均匀骰子,A=掷出2点,,B=掷出偶数点,,P(A|B)=?,已知事件B发生,此时试验所有可能结果构成的集合就是B,,P(A|B)= 1/3.,B中共有3个元素,它们的出现是等可能的,其中只有1个在集A中.,容易看到,P(A|B),于是,P(A )=3/10,,又如,10件产品中有7件正品,3件次品,7件正品中有3件一等品,4件二等品. 现从这10件中任取一件,记,B=取到正品,A=取到一等品,,P(A|B),则,P(A)=3/10,,B=取到正品,P(A|B)=3/7,本例中,计算P(A)时,
3、依据的前提条件是10件产品中一等品的比例.,A=取到一等品,,计算P(A|B)时,这个前提条件未变,只是加上“事件B已发生”这个新的条件.,这好象给了我们一个“情报”,使我们得以在某个缩小了的范围内来考虑问题.,条件概率的直观定义 某个事件发生的可能性大小经常会受到另一相关事件发生与否的影响. 若在事件 已发生的条件下,事件 发生的概率为 则称 为在已知 发生的条件下, 发生的条件概率,记为,Example,考虑美国东部某大城市警察局男性与女性警官的升职情况.警察局有1200名警官,男性960人,女性240人. 在过去两年中有324名警官得到提升,男性288人,女性36人. 在浏览了升职记录后
4、,一个由女性警官组成的委员会指出在升职过程中存在性别歧视. 其依据是升职人数男性与女性比为288:36;而警察局官员否认歧视,认为男性升职多只是因为警官中男性本来就比女性多很多. 经过计算,男性警官升职概率为0.30,女性警官升职概率为0.15. 条件概率的使用本身不能表明歧视的存在,但条件概率的数值则成为女警官们指控的有力证据!,1. 在古典概型中,讨论 时,样本空间已缩小为“包含 的所有事件”,故,2. 同样,在几何概型中,若事件B已发生, 则为使 A也发生 , 试验结果必须是既在 B 中又在A中的样本点 , 即此点必属于AB. 由于我们已经知道B已发生, 故B变成了新的样本空间 , 于是
5、 有(1).,设A、B是两个事件,且P(B)0,则称 (1),定义2.1.1(conditional probability),为在事件B发生的条件下,事件A的条件概率.,条件概率的性质,譬如,2)从加入条件后改变了的情况去算,条件概率的计算,1) 用定义计算:,P(B)0,P(A|B)=,B发生后的缩减 样本空间所含样 本点总数,在缩减样本空 间中A所含样 本点个数,Sample space,Reduced sample space given event B,条件概率 P(A|B)的样本空间,例 甲、乙两厂共同生产1000个零件,其中 300件是乙厂生产的. 而在这300个零件中,有189
6、个是标准件,现从这1000个零件中任取一个,问这个零件是乙厂生产的标准件的概率是多少?,所求为P(AB).,甲、乙共生产 1000 个,189个是 标准件,300个 乙厂生产,设B=零件是乙厂生产,A=是标准件,所求为P(AB) .,设B=零件是乙厂生产,A=是标准件,若改为“发现它是 乙厂生产的,问它 是标准件的概率 是多少?”,求的是 P(A|B) .,B发生, 在P(AB)中作为结果; 在P(A|B)中作为条件.,例 人寿保险公司常常需要知道存活到某一个年龄段的人在下一年仍然存活的概率。根据统计资料可知,某城市的人由出生活到50岁的概率为0.90718,存活到51岁的概率为0.90135
7、。问现在已经50岁的人,能够活到51岁的概率是多少?,解,记,因此,要求,显然,因为,从而,可知该城市的人在50岁到51岁之间死亡的概率约为0.00643。在平均意义下,该年龄段中每千个人中间约有6.43人死亡。,由条件概率的定义:,即 若P(B)0,则P(AB)=P(B)P(A|B) (2),而 P(AB)=P(BA),乘法公式,若已知P(B), P(A|B)时, 可以反求P(AB).,将A、B的位置对调,有,故 P(A)0 , 则 P(AB)=P(A)P(B|A) (3),若 P(A)0,则P(BA)=P(A)P(B|A),(2)和(3)式都称为乘法公式, 利用 它们可计算两个事件同时发生
8、的概率,乘法公式应用举例,一个罐子中包含 b 个白球和 r 个红球. 随机地抽取一个球,观看颜色后放回罐中,并且再加进 c 个与所抽出的球具有相同颜色的球. 这种手续进行四次,试求第一、二次取到白球且第三、四次取到红球的概率.,波里亚(Plya)罐子模型,于是W1W2R3R4表示事件“连续取四个球,第一、第二个是白球,第三、四个是红球. ”,随机取一个球,观看颜色后放回罐中,并且再加进 c 个与所抽出的球具有相同颜色的球.,解 设 Wi=第i次取出是白球, i=1,2,3,4,Rj=第j次取出是红球, j=1,2,3,4,用乘法公式容易求出,当 c 0 时,由于每次取出球后会增加下一次也取到同
9、色球的概率. 这是一个传染病模型. 每次发现一个传染病患者,都会增加再传染的概率.,=P(W1)P(W2|W1)P(R3|W1W2)P(R4|W1W2R3),P(W1W2R3R4),样本空间的分割,二、全概率公式,图示,证明,化整为零 各个击破,某一事件 B 的发生有各种可能的原因 ,如果 B是由原因 Ai (i=1,2,n) 所引起,则 B 发生的概率是,每一原因都可能导致 B 发生,故 B 发生的概率是各原因引起 B 发生概率的总和,即全概率公式.,P (BAi) = P(Ai) P(B |Ai),全概率公式.,我们还可以从另一个角度去理解,由此可以形象地把全概率公式看成为“由原因推结果”
10、,每个原因对结果的发生有一定的“作用”,即结果发生的可能性与各种原因的“作用”大小有关. 全概率公式表达了它们之间的关系.,诸 Ai 是原因 B 是结果,例 有一批同一型号的产品,已知其中由一厂生产的占 30% , 二厂生产的占 50% , 三厂生产的占 20%, 又知这三个厂的产品次品率分别为2% , 1%, 1%,问从这批产品中任取一件是次品的概率是多少?,设事件 A 为“任取一件为次品”,解,由全概率公式得,30%,20%,50%,2%,1%,1%,称此为贝叶斯公式.,三、贝叶斯公式,贝叶斯资料,证明,证毕,贝叶斯公式在实际中有很多应用.,它可以帮助人们确定某结果(事件 B)发生的最可能
11、原因.,全概率公式,贝叶斯公式,若干原因,结果,如果把随机事件 B 看成是结果,随机事件组 A1,An 看成可能导致结果 B 发生的若干原因,,贝叶斯公式在决策理论中有重要应用: 不断地根据新得到的信息来修正原来的观点。,例 某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?,则 表示“抽查的人不患癌症”.,已知 P(C)=0.005, P( )=0.995, P(A|C)=0.95, P(A| )=0.04,求解如下:,设 C=抽查的人患有癌症, A=试验结果是
12、阳性,,求 P(C|A).,现在来分析一下结果的意义.,由贝叶斯公式,可得,代入数据计算得 P(CA)= 0.1066,2. 检出阳性是否一定患有癌症?,1. 这种试验对于诊断一个人是否患有癌症有无意义?,如果不做试验,抽查一人,他是患者的概率,患者阳性反应的概率是0.95,若试验后得阳性反应 则根据试验得来的信息,此人是患者的概率为,从0.005增加到0.1066,将近增加约21倍.,1. 这种试验对于诊断一个人是否患有癌症有意义.,P(CA)= 0.1066,P(C)=0.005,试验结果为阳性 , 此人确患癌症的概率为 P(CA)=0.1066,2. 即使你检出阳性,尚可不必过早下结论你
13、有癌症,这种可能性只有10.66% (平均来说,1000个人中大约只有107人确患癌症),此时医生常要通过再试验来确认.,PET/CT是当今最高端的医学影像诊断设备,能为确定和查找肿瘤及其他病灶的精确位置定量、定性诊断提供依据。PET/CT检查费用昂贵,动辄上万元一次 。(广州日报,2012-04-15) 一项研究指出,在用PET/CT对50岁59岁的健康日本人进行体检时发现,其阳性预测值仅有3.3%。也就是说,经PET/CT体检发现有肿瘤异常的患者中,近97%都不是真正的恶性肿瘤患者。(亚太肿瘤预防杂志, 2007),Example in Practice,P(Ai) (i=1,2,n) 是
14、在没有进一步信息(不知道事件B是否发生)的情况下,人们对诸事件发生可能性大小的认识.,当有了新的信息(知道B发生),人们对诸事件发 生可能性大小P(Ai | B)有了新的估计.,贝叶斯公式从数量上刻划了这种变化,在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为原因的先验概率和后验概率.,Example 甲、乙、丙三囚犯,国王宣布以抽签决定释放一位,处决另两位。 他告诉狱卒那一位将被释放,但要求狱卒不可先透露。 甲请狱卒透露那一位被释放遭拒后,改问狱卒: 乙及丙中,那一位会被处决? 狱卒经一番思考,遂(诚实地)告诉甲: 乙会遭处决。,他认为这样做并未违反国王规定: 乙、丙二人,至少有一会遭处
15、决,这是大家都知道的,因此他并未提供甲任何有关甲会被释放的有用信息。 甲听到狱卒说乙会被处决后很高兴。原先他有1/3的机率遭释放,现在因只剩他与丙了,所以机率提高至1/2。 狱卒与甲的分析,何者正确?,解. 令A,B,C分别表甲、乙、丙三人会被释放的事件。 K表狱卒说乙会被处决的事件。 样本空间 =ABC。 由假设 P(A)=P(B)=P(C)=1/3。 想求P(A|K)。,若丙偷听到狱卒与甲的对话,则知他会被释放的机率提高至2/3。 若乙偷听到狱卒与甲的对话,则知他没有活命机会。 乙、丙二人中,有一人被释放之机率为2/3,若给定乙被处决,则丙便独自拥有全部被释放之机率2/3。,狱卒所提供的信
16、息是否无用?,至于甲,被释放之机率不会改变,还是1/3。 而三人被释放之条件机率和: P(A|K)+P(B|K)+P(C|K) = 1/3+0+2/3 = 1。,此例有时候以不同的型式出现,如汽车与山羊问题(Car-Goat Problem)。 在电影斗智21点(21)中曾出现。,三羊问题,斗智21点的一个场景: 参加一个游戏,有三扇门。 一门后有一辆车,另两门后有羊,主持人让你随意挑。 当你选择了一扇门后,主持人随后打开了其余两扇门中一扇有羊的门。 此时问你是否换到剩下的一扇门? 是否换?为什么?概率多少?,主人公选择:换!,选择正确!换的话得到车的概率是2/3.,2008年美国总统大选,9
17、月4日,美国共和党的全国代表大会上,阿拉斯加州长佩林(Sarah Palin) ,被提名为共和党的副总统候选人。 原先共和党总统候选人麦凯恩(John McCain)的民意支持度,落后民主党的总统候选人奥巴马(Barack Obama)。 提名佩林后,麦凯恩人气迅速窜升,声势立涨,在几份民调中,均胜过奥巴马。,维吉尼亚大学政治学者萨巴托(Larry Sabato),根据1960年以来的分析,指出全代会后民调结果与大选结果相符者,只有一半: 跟丢铜板预测差不多 You could flip a coin and be about as predictive.,对共和党而言,是否全代会后随即做的民
18、调,不论领先或落后,于当年11月的总统大选,其提名人当选或落选之机率相同? 民调无用?只需丢铜板?,依萨巴托的分析,设 P(当选|领先)=P(落选|领先)=1/2,(*) 其中 领先表两党已决定正副总统候选人后,对两组候选人所立即做的民调,共和党领先; 当选表在当年总统大选时,共和党获胜。,P(当选|落后)=P(落选|落后)?(*) 若成立,则全代会后的民调领先或落后,共和党便可不必在意。甚至此民调根本就是多余的。,令 P(当选|落后) =a, P(落选|落后)=1-a。 由(*)并无法决定a。再令 P(当选)=r,P(领先)=s。 P(当选) =P(当选|领先)P(领先) +P(当选|落后)
19、P(落后)。,r = s = 1/2 a = 1/2 (*)成立。 r = 0.48,s = 0.5 a = 0.46 1/2 。 a值乃与r及s有关!,Example,小汽车油耗小,但不如大汽车安全. 小汽车事故中死亡率为0.128,大汽车事故中死亡率为0.05. 某城市小汽车的市场占有率为18%. 1.请问该市事故中的死亡率是多少?(假定事故发生与车型无关),2.若某次事故中有死亡发生,请问该事故由小汽车引起的概率是多少?,Thomas Bayes,Born: 1702 in London, England Died: 17 April 1761 in Tunbridge Wells, K
20、ent, England,概率论理论创立人,如果你使用过Google, 你就已经从贝叶斯的理论中收益了。,搜索巨人 Google 和 Autonomy (一家出售信息恢复工具的公司),都使用了Bayesian principles 为数据搜索提供近似的.研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系, 开发能够根据数据和经验来决定行动的人工智能设备, 创建个人机器人. 值得一提的是,后来的学者还依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计”. 可见贝叶斯公式的影响.,Thomas Bayes,一位伟大的数学大师, 1702年出生于伦敦, 后来成为了一名Presbyte
21、rian minister. 和他的同事们不同:他认为上帝的存在可以通过方程式证明,虽然他看到了自己的两篇论文被发表了, 但是Essay Toward Solving a Problem in the Doctrine of Chances却一直到他死后的第三年(1764年)才被发表. 他的理论很有效, 照亮了今天的计算领域, 研究者正在把对这种思想的应用从基因研究推广到fillering email的研究.,显然 P(A|B)=P(A),这就是说,已知事件B发生,并不影响事件A发生的概率,这时称事件A、B独立.,2. 事件独立性,A=第二次掷出6点, B=第一次掷出6点,,先看一个例子:,将
22、一颗均匀骰子连掷两次,,设,一、两个事件的独立性,由乘法公式知,当事件A、B独立时,有 P(AB)=P(A) P(B),用P(AB)=P(A) P(B)刻划独立性,比用 P(A|B) = P(A) 或 P(B|A) = P(B) 更好,它不受 P(B)0 或 P(A)0 的制约.,若两事件A、B满足 P(AB)= P(A) P(B) (1) 则称A、B是统计独立的,简称A、B独立.,两事件独立(independent)的定义,例1 从一副不含大小王的扑克牌中任取一张,记 A=抽到K, B=抽到的牌是黑色的,可见, P(AB)=P(A)P(B),由于 P(A)=4/52=1/13,故 事件A、B
23、独立.,问事件A、B是否独立?,解,P(AB)=2/52=1/26.,P(B)=26/52=1/2,前面我们是根据两事件独立的定义作出结论的,也可以通过计算条件概率去做:,从一副不含大小王的扑克牌中任取一张,记 A=抽到K, B=抽到的牌是黑色的,在实际应用中, 往往根据问题的实际意义去判断两事件是否独立.,可见 P(A)= P(A|B), 即事件A、B独立.,则,P(A)=1/13, P(A|B)=2/26=1/13,在实际应用中,往往根据问题的实际意义去判断两事件是否独立.,由于“甲命中”并不影响“乙命中”的概率,故认为A、B独立 .,甲、乙两人向同一目标射击,记 A=甲命中, B=乙命中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 基础 第二 条件 概率 统计 独立性
链接地址:https://www.31doc.com/p-2135120.html