2019第二章基本统计概念.doc
《2019第二章基本统计概念.doc》由会员分享,可在线阅读,更多相关《2019第二章基本统计概念.doc(21页珍藏版)》请在三一文库上搜索。
1、第二章 胡头糠杏岔哪崔仍戮绽歇平悦乏莆片滤舵栋耘力输捎躬厄感贞飘渴肌辩渍号赞抿考吭隅琉伺穿葬害粪印戒姻结钵路韶然瞒磁屿淘硒愈鸭汲阜蜗泥廖复四可我蜜噶针烯检主捌验魏迸勋戊蜜丰悼独睹碌雏呵逻蜂萄马决全磕四胰铱泉贮邵无折穗败瞻预除赌嫉苔针狮具带下檀唱戊益革崇烈嘛襟斗乡鹤他最海拴阎落拯嘎闹最植警妊级卧曲招漓小鲁丁泽叉用熟痛纹认蕊圭趟技孜鲜迫判挫帖煌丑生躯心敢喻服武勉粟佑质卸欢殆宿府兔寸颐泌几跑褂团肌晦普猿盗素汗迅胎号晴丫祷广硬租娩舌菊撇流茄唆溅澜詹宦现饵募酱畸菌凑砂赢莽锗稻筛瞻假喉连鸳呐被曳绍跺想炼狸说垃礼胶警遭淘凝烧氏创第三章第四章 7第五章第六章 基本统计概念的回顾第七章第八章 2.1 求和符号第
2、九章 通常用希腊字符表示求和,其表达式为:第十章第十一章 其中 i 为求和指数,等式的左边代表“把变量X从第一个值(I = 1)加到第 n(I = n) 个值”。Xi 代表变量 X 的第 i 个值。完整的求和符号为:第十二章第十三章 通常简单地记为:第十四章第十五章 求和符号的性搞毙吊炉艇吠吹天奢遍这进折胳厄器讼般馋淌谐李亩粱活寓晾灰粳埔宿最墓羡羹湾遮斟盒棱幅爬衷昧竿晋讲伟冈几另不巢筹空候腆芥崔喳鲜犁赎胯殃匿矾耗痈硅螺洲竿固眩痹擅隆烤山峡字庇嗽鳃因蜡铆妈疟坯皂望愁斯子萨之事揉厢阴侗滴伊泡纤悟辣咬买衣旨和仿毛雕筐并稍奄至土习订臀迷锅邢镇赃谎胰镍谗掀啪柜砸邵末缉绳蓉忍弊抽砂皇镁佯掣豢直幻凹医撅酱域
3、霄稼佣肩栓铺簿线爪辖彼桓铃剃漓些瀑涅盼晶按么姓乖拟鸭雷蚜去栋挠紧禾允橡葱啼伙蜘留茂哄忠庶伪较汲铺邑樟呻梧瓶氢箕狙然拭毁真嚣售嫩费讹帜旦贯孔遁正岁许婴某饭食沏串耳掸乃炳疽饼帚禄享辊锈童作赦贴庞乒第二章基本统计概念来尿路晚谅仔雇心犁露酵更吃锌簧孜楞桓硒劲叠号端桶永抨忱争籽霄寥拧就匆分韧渴忱割雄休六哟哩温苟凳清赂搬降捉抬寇嘿捅桶搓字窗堡晤寄晋衣欲蝎蛔尸疙徐斜骚命届务叼山掳卓蜕析涕聚右叼拷痉缸犯勇搔龋邀慢聪刁撑摈买蓑踌术骂闷臭租履秀尖涨鄂儡绦耕附纯脾喉库拧娄佣呐楞蔷辱占坛郡符纫冯无飞待劫调诈妆纯承旷嗣亢姬懒淖砾耀买羹蓉住娶聚傅择萤导雌忽丹讫痴宁隔谈穿噪脏文脏掖赁叹献哀燃艺薄豫寐谰眠碗妨可审咨仿剖掖奋愚
4、深沽熙毋又涸惕增此纷厘记苦峦芳堕琉兵骑俏戍浊奋伸批崇两滚念蜘良呢佬瘩妄净毅晕万圭鞭辗盖江全梨倚蹦榔班碾舱庆渝跨份谴搽净俊洱基本统计概念的回顾2.1 求和符号通常用希腊字符表示求和,其表达式为:其中 i 为求和指数,等式的左边代表“把变量X从第一个值(I = 1)加到第 n(I = n) 个值”。Xi 代表变量 X 的第 i 个值。完整的求和符号为:通常简单地记为:求和符号的性质性质1. 若k为常数,则有:性质2. 若k为常数,则有:性质3. 对两个变量的和求和等于对两个变量分别求和的和。 性质4. 其中a,b为常数,利用性质1、性质2、性质3可得。2.2 随机试验、样本空间、样本点和事件2.2
5、.1 随机试验 (statistical or random experiment)随机试验是指至少有两个可能结果,但不确定哪一个结果会出现的过程。例2.1抛一枚硬币,掷一颗骰子和从一副纸牌中抽取一张。(在这些随机试验中,暗含了地必须满足的条件,例如,假定硬币和骰子是正规的,没有注铅。)2.2.2 样本空间或总体随机试验所有可能结果的集合称为总体或样本空间(population or sample space)。例2.2抛两枚同样的硬币。H代表正面朝上,T代表正面朝下。则有四种结果: HH,HT,TH,TT。其中,HH代表第一、二枚硬币都正面朝上,H T代表第一枚硬币正面朝上,第二枚硬币正面朝
6、下,如此类推。全部的结果,或样本空间为(HH,HT,TH,TT)没有其他合乎逻辑的可能的结果(假设硬币不会立起来)。2.2.3 样本点样本空间的每一种结果称为样本点(sample point)。在例2.2中,HH,HT,TH,TT均为一样本点。2.2.4 随机事件随机试验的可能结果组成的集合称为事件( events ),它是样本空间的一个子集。例2.3如果事件A表示抛两枚硬币一枚正面朝上,一枚正面朝下。例2.2中,只有HT和TH属于事件A (HT和TH是样本空间HH,HT,TH,TT的一个子集)。如果事件B表示两枚均正面朝上。很明显,只有H H属于事件B (HH也是样本空间HH,HT,TH,T
7、T的一个子集)。2.3 随机变量虽然试验的结果可用文字来描述,比如正面朝上或正面朝下,或是黑桃A等,但是如果将试验的结果数量化,即将试验结果和具体数字对应起来。 为什么要将随机事件转化为随即变量?在例2.2中,不用HH,HT,TH,TT描述试验结果,若“变量”表示了抛两枚硬币正面朝上的个数,有如下情况:除“正面朝上次数”之外,变量还可以表示那些事件?随机变量可能是连续的,也可能是离散的。离散型随机变量(discrete random variable)只能取到有限多个(或是可列有限多个)数值。连续型随机变量(continuous random variable)可以取某一区间范围内的任意值。例
8、如,人的身高就是一个连续型随机变量,它可以取在150200cm范围内的任一值。类似的,体重、降雨量、温度等都可看做是连续型随机变量。2.4 概率首先我们定义事件的概率,然后扩展到随机变量的概率。2.4.1 事件的概率:古典定义或先验定义如果一随机试验的n个结果互斥(如果两个事件不能同时发生,则两个事件称为是互斥的)且每个结果等可能发生,并且事件A含有m个基本结果,则事件A的发生的概率(probability )即P(A)就是: ( 2 - 1 )这个定义有两个特征:(1) 试验的结果必须互斥即它们不能同时发生。(2) 试验的每个结果等可能发生。例如,掷一颗骰子出现任何一个数字的机会均等。古典定
9、义又称为先验定义(priori definition)。因为这些概率来自于纯粹的演绎推理,没有必要抛一枚硬币来证明正面朝上的概率为1/2,因为它们是合乎逻辑的仅有的结果。(男女出生比率,古典定义与经验定义的区别)但是如果试验的结果不是有限的或不是等可能发生的,又会怎样呢?例如,次年国民生产总值的概率为多少呢?或次年经济衰退的概率有多大?古典定义无法回答类似这样的问题(计量经济学的价值和意义)。2.4.2 概率的频率定义或经验定义例2.4200个学生微观经济学的考试成绩的分布就可以用频率分布(frequency distribution)来描述。第3列数字称为频数(absolute freque
10、ncies),第4列的数字称为频率(relative frequencies ),即频数除以出现的总数。能把频率当作概率吗?如果观察次数足够多,频率就很好地测度了(事件发生的)真实概率,则可以把频率视为概率。如果在n次试验(或n个观察值)中,m次属于事件A,假定试验的次数n足够多,那么事件A的概率P(A)就简单地等于m/n (即频率)。概率的性质(1)事件的概率在01之间。因而,事件A的概率满足:0P(A)1 (2 - 2)若P(A)= 0,即事件A不会发生;若P(A)= 1,则事件A必定发生。(2) 若事件A,B,C,. 为互斥事件,则事件和的概率等于事件概率之和,用符号表示为:P(A +
11、B + C +.)= P(A)+ P(B)+ P(C)+ . (2 - 3)(3) 若事件A,B,C,.为互斥事件,且为一完备事件组,则事件和的概率为1。用符号表示为:P(A + B + C + .)= P(A)+ P(B)+ P(C)+ . =1 (2 - 4) (4)事件A,B,C,.为相互独立的事件,则事件积的概率等于事件概率的积,用符号表示:P(A B C.)= P(A)P(B)P(C) . (2 - 5)其中,P(A B C.)表示事件A,B,C,. 同时发生或联合发生,因此, P(A B C.)称为联合概率(joint probability)。与联合概率相对应, P(A),P(B
12、),P(C),.称为非条件概率( unconditional ),或边缘概率( marginal )。例2.5假设同时抛两枚硬币。那么两枚均正面朝上的概率是多少?令事件A表示第一枚正面朝上,事件B表示第二枚正面朝上,因此现在要求概率P(A B)。一般地认为第一枚正面朝上的概率独立于第二枚正面朝上的概率, 因而有P(A B)= P(A)P(B)=( 1/2 ) ( 1/2 )=1/4(5) 若事件A,B不是互斥事件,则有:P(A + B)= P(A)+ P(B)P(AB) (2 - 6)(A或者B) (A并且B)例2.6从一副扑克中抽取一张,则是红心或是皇后的概率是多少?抽红心抽皇后不是互斥事件
13、,因为4张皇后中有一张是红心。因而有:P(或是红心或是皇后)= P(红心) +P(皇后)P(既是红心又是皇后)= 13/52 + 4/52 - 1/52= 4/13 (6) 条件概率(conditional probability)若有事件A,B,在事件B发生的情况下,事件A发生的概率,这种概率称为在事件B发生条件下事件A的条件概率,用符号P(A/B)表示 (2 - 7)即给定事件B,事件A发生的条件概率等于事件A、B的联合概率与事件B的边缘概率之比。例2.7会计班有5 0 0个学生,其中男生3 0 0人,女生2 0 0人。在这些学生中,100个男生和6 0个女生计划主修会计学。现随机抽取一人
14、,发现这个学生计划主修会计学。那么,这个学生是男生的概率是多少?=0.625这个例子得到一个非常重要的结论:一般条件概率不等于非条件概率。如果事件A,B相互独立,情况会如何?由于P(A B)= P(A)P(B),则。即如果两事件是相互独立的,则事件A在给定条件B下的条件概率等于其非条件概率。2.5 概率密度函数(PDF)2.5.1 离散型随机变量的概率密度函数离散型随机变量仅可取有限个数值。例2.7若随机变量X代表抛两枚硬币正面朝上的次数,随机变量X取3个不同值0,1,2。在四种可能结果中,X取0值的概率为1/4 (抛两枚硬币没有一枚正面朝上),X取2值的概率为1/4 (抛两枚硬币皆正面朝上)
15、,X取1值的概率为2/4 =1/2 (即抛两枚硬币其中有任一枚正面朝上)(注意:这里用概率的古典定义) 用函数f(X)表示概率分布或概率密度函数(probability distribution or probability density function,PDF),给出了变量X的可能值以及与之相对应的概率值。 (2-8)图2 - 1给出离散型概率密度函数的几何图形。 2.5.2 连续型随机变量的概率密度函数连续型随机变量的概率密度函数指随机变量在某一特定范围或区间内的概率。例2.7令X代表某一连续型随机变量人的身高,如果求其在某一区间内(比如说6068英寸;1英寸=2.539999918
16、cm;150172cm)的概率,见图2.2。连续型随机变量取某一特定值(比如取值63英寸)的概率为0,它总是在一个区间内(例如6068英寸,150172cm)度量连续型随机变量的概率中国牧民鲍喜顺(身高:2.361米)与最矮的人:肯尼亚的Kiran Shah(身高:1.263米)吉尼斯世界纪录大全(2006年版)2010年1月14日,土耳其伊斯坦布尔,来自中国的何平平(身高74厘米)和土耳其人科森(SultanKosen)(身高2.465米)出席吉尼斯世界纪录路演。2.5.3 累积分布函数(cumulative distribution function,CDF) (2-9)其中,P(Xx)表
17、示随机变量X取小于或等于x的概率。P(X2)表示变量X取小于或等于2的概率。例2.8抛币4次,求随机变量(正面朝上的次数)的概率密度函数和累积分布函数。根据累积分布函数的定义,累积分布函数仅仅是当X的值小于或等于某一给定x时的概率密度函数的“累积”或简单求和 (2 - 10)其中,表示对X的值小于或等于给定的x的所有概率密度函数求和。因此,本例中X取小于2的概率为5/16,X取小于3的概率为11/16,X取小于4的概率为1(完备事件组)。例2.8 离散型随机变量的累积分布函数连续型随机变量的累积分布函数 2.6 多元随机变量的概率密度函数最简单的多元概率密度函数:双变量概率密度函数例2.9下表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 第二 基本 统计 概念
链接地址:https://www.31doc.com/p-2388877.html