《[理学]sas讲稿第3章.doc》由会员分享,可在线阅读,更多相关《[理学]sas讲稿第3章.doc(54页珍藏版)》请在三一文库上搜索。
1、第 54 页 共 54页SAS软件与应用统计第三章 置信估计与假设检验3.1 置信区间3.1.1 概述1. 点估计 用样本的统计量估计总体的某数字特征或参数称为点估计。如:用估计m,S估计,即样本均值估计总体均值,样本方差估计总体方差。 注意到,样本是具有随机性的,不同的样本产生总体均值的不同的估计值,这些估计值间的差异就是总体均值估计量的差异,所以不能把样本均值作为总体均值绝对精确的估计,而是需要总体均值的置信区间来估计总体均值。我们把具有一定可靠性和精度的估计称为置信估计。2. 中心极限定理(Control Limit Theoren) 中心极限定理,对几乎任何总体的独立随机样本,当样本容
2、量足够大时: 样本均值的分布接近于正态分布; 样本均值接近于总体均值。3. 正态分布 正态分布描述落入不同范围的概率。近似地有 68的数据落入均值为中心一倍标准差的范围内; 95的数据落入均值为中心两倍标准差的范围内; 99的数据落入均值为中心三倍标准差的范围内。4. 置信区间 (1) 一般地,对于总体的未知参数,其置信区间(a, b)是指由统计量a,b确定的区间,它满足P(a b) = 1 。 其中的1 称为置信水平。a,b分别称为置信下限和置信上限。上式的含义是以1 的概率保证在(a, b)中取值。 (2) 正态分布总体方差已知时,使用z值法,均值的置信水平为1 的置信区间为:; 正态分布
3、总体方差未知时,使用t值法,均值的置信水平为1 的置信区间为:。 说明: 由于总体方差不易求出,所以大多使用t值法,SAS中的置信区间也是使用此法求出。 (3) 置信区间的长度取决于置信水平、数据的波动和样本容量: 置信水平越高,置信区间长度越大; 样本方差越大,置信区间长度越大; 在相同的置信水平和方差的情况下,增加样本的容量可以减少置信区间的长度。 选择置信水平和样本容量使置信区间有实用价值是重要的,一个很高的置信水平和很小的样本容量可使置信区间长得毫无实用价值。3.1.2 INSIGHT作均值、标准差、方差的置信区间 在SASINSIGHT中提供了计算正态总体均值的置信区间的功能。下面举
4、例说明如何从数据集SASUSER.CLASS得到变量HEIGHT的置信水平为95的置信区间: (1) 首先启动SAS/INSIGHT,并打开数据集SASUSER.CLASS。图3-1 95Confidence Interval (2) 选择菜单“Analyze(分析)”“Distribution(Y)(拟合分布)”;(3) 在打开的“Distribution(Y)”对话框中选定分析变量:选择变量HEIGHT,单击“Y”按钮,将变量移到右上方的列表框中; (4) 单击“Output”按钮,在打开的对话框中选中,“Basic Confidence interval”复选框; (5) 两次单击“OK
5、”按钮,得到变量的分析结果;其中包括一个名为“95Confidence Interval”的列表,表中给出了均值、标准差、方差的估计量以及置信下限和置信上限。如图3-1所示。 若要得到其它置信水平的置信区间,例如要97.5的置信区间,可以选择菜单“Tables”“Basic Confidence Interval”“Others”,在打开的“Basic Confidence Interval”对话框中修改置信水平,如图3-2所示。 图3-2 97.5%置信水平 可以看到,由于置信水平的提高,置信区间的长度在增加。3.1.3 用分析员应用作置信区间 在分析员应用中,置信估计是假设检验功能的一部分
6、。因此,要得到某一参数的置信区间,需要从关于这参数的检验菜单进入。下面说明如何从数据集SASUSER.CLASS得到变量HEIGHT的置信区间: 首先在“分析员应用”中打开数据集SASUSER.CLASS。1. 均值的置信区间 (1) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“One Sample t test for a Mean(单样本均值T检验)”; (2) 在打开的“One Sample t test for a Mean”对话框中选择变量“HEIGHT”,单击“Variable”,将其移到“Variable”中,如图3-3左所示; 图3
7、-3 设置均值的置信区间 (3) 单击“Tests”按钮,在打开的对话框中选择置信估计类型和置信水平,如图3-3右所示; (4) 两次单击“OK”按钮,在显示的结果中(图3-4),有一部分为关于置信估计的。图3-4 均值的置信区间2. 方差的置信区间 (1) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“One Sample Test for a Variance(单样本方差检验)”; (2) 在打开的“One Sample Test for a Variance”对话框中选择变量“HEIGHT”,单击“Variable”,将其移到“Variable
8、”中; (3) 在“Var =”右边的框中输入任一正数,例如1,如图3-5左所示; (4) 单击“Intervals”按钮,打开“One Sample Test for a Variance:Intervals”对话框,如图3-5右,选定置信估计类型和置信水平。 图3-5 设置方差的置信区间 (5) 两次单击“OK”按钮,得到结果如图3-6所示。图3-6 方差的置信区间3. 比例的置信区间 (1) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“One Sample Test for a Proportion(单样本比例检验)”; (2) 在打开的“O
9、ne Sample Test for a Proportion”对话框中选择变量“SEX”,单击“Variable”,将其移到“Variable”中; (3) 单击“Level of Interest”下拉框右侧的下拉尖头,选M(男),如图3-7左所示; (4) 单击“Intervals”按钮,在打开的对话框中选定置信估计类型和置信水平,如图3-7右所示。 图3-7 设置比例的置信区间 (5) 两次单击“OK”按钮,得到结果如图3-8所示。图3-8 比例(概率)检验的置信区间3.2 假设检验3.2.1 法院判决的类比 在刑事庭上,因为怀疑某人在一个案子中犯罪而将他作为被告进行审判。审判的过程是
10、如何进行的呢? 1) 确定原假设(null hypothesis)和备选假设(alternative hypothesis)。备选假设是最初研究的假设(被告是有罪的),原假设是与备选假设在逻辑上对立的假设(被告是无罪的); 2) 选一个显著水平(significance level),一个拒绝原假设所需要的证据的数量。在法庭上,证据必须证明罪犯超过了“合理怀疑”的水平; 3) 收集证据; 4) 运用决策规则判决,若 证据是足够的有力,拒绝原假设, 证据不是足够的有力,不能拒绝原假设。注意不能证明是有罪的并不是证明无罪的, 统计假设检验也按同一思路进行。3.2.2 钱币例子类比 为了检验投一个钱
11、币两面出现是否公平: 1) 你怀疑正反面出现是有偏的,对照法庭的例子先假定钱币两面出现是公平的。 2) 选一个显著水平,若一次连续看到五次正面或五次反面,就认为是有偏的,否则将证明有偏的证据不足。 3) 投币五次并记录正反面出现的次数。 4) 将决策规则用于试验的数据并作出决定: 或者有足够的证据拒绝钱币是公平的假定; 或者无足够的证据拒绝钱币是公平的假定。3.2.3 两种错误类型1. 第一类错误 原假设成立时拒绝原假设称为第一类错误。第一类错误的概率常以a表示,它是原假设为真时拒绝原假设的概率, 它也被称为检验法的显著水平,a常取0.05 在法庭审判的例子里,就是他无罪时而法庭作出有罪的判决
12、的概率; 在投币的例子里,就是钱币是公正的而被认为是不公正的概率。2. 第二类错误 原假设不成立时接受原假设称为第二类错误。 第二类错误的概率常以b表示,它是原假设不对时没有拒绝原假设的概率。 在法庭审判的例子里,就是他有罪时而法庭作出无罪的判决的概率; 在投币的例子里,就是钱币是有偏的而未能断定它是有偏的概率。3.2.4 统计假设检验 确立和解决一个假设检验问题有以下几步: 1) 根据问题确立原假设H0和备选假设H1,H0通常是一个等式; 2) 确定一个显著水平a,它是衡量稀有性(小概率事件)的标准,常取为0.05;3) 选定合适的检验用统计量(在原假设成立时它的分布是已知的),并由样本观测
13、值计算统计量的观测值和衡量观测结果极端性的p值。为由样本观测值计算得的Z统计量的观测值 说明:已知总体方差时,用Z统计量,总体方差未知时,用t统计量。(统计量N(0,1),统计量T(n 1) 4) 比较p和a作判断:p a,拒绝原假设;p a,接受原假设。 在SAS系统中,用户只需根据软件提供的p值就可应用于不同的显著水平,作出拒绝或接受原假设的决定。3.2.5 用INSIGHT作均值检验 在INSIGHT中要根据样本数据对某个变量的均值进行检验,例如要从SASUSER.CLASS出发检验变量WEIGHT的均值与50公斤是否有显著差异。 步骤如下: (1) 首先启动SAS/INSIGHT,并打
14、开数据集SASUSER.CLASS。 (2) 选择菜单“Analyze(分析)”“Distribution(Y)(拟合分布)”; (3) 在打开的“Distribution(Y)”对话框中选定分析变量:选择变量WEIGHT,单击“Y”按钮,将变量移到右上方的列表框中; (4) 单击“OK”按钮,得到变量的描述性统计量; (5) 选择菜单“Tables”“Tests for Location”;在弹出的对话框中输入50,如图3-9所示。 图3-9 均值检验 从显示结果可以看到三种检验法计算出的p值都小于0.05,所以应拒绝原假设,即总体的均值与50有显著差异。 事实上,Distribution(
15、Y)的结果中可以看到WEIGHT的样本均值是100.0263。(想一想样本均值是与总体均值的关系?)如将上面(5)中的50改为100,从显示结果可以看到三种检验法计算出的p值都大于0.05,所以不能拒绝原假设,即总体的均值与100无显著差异。3.2.6 用分析员应用作参数检验 在分析员应用中,打开数据集后,要利用打开的数据集进行参数检验都从以下方式进入: 选择菜单“Statistics(统计)”“(假设检验)”;在弹出的子菜单中列举了8种检验法,其前4种为单样本的参数检验法:One Sample Z test for a Mean(单样本均值Z检验法);One Sample t test fo
16、r a Mean(单样本均值t检验法);One Sample Test for a Proportion(单样本比例检验法);One Sample Test for a Variance(单样本方差检验法)。1. 均值检验 以数据集SASUSER.CLASS为样本数据集,希望通过样本数据检验变量WEIGHT均值的如下假设: H0:u = 52,H1:u 52。 由于此时方差未知,所以使用t检验法。步骤如下:图3-10 设置均值检验 (1) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“One Sample t test for a Mean(单样本均
17、值t检验法)”,打开“One Sample t test for a Mean”对话框; (2) 选中变量“weight”,单击“Variable”按钮,将其移到“Variable”框中; (3) 在假设框“Mean=”右边的文本框中填入原假设的均值数据52,并回车,然后单击备选假设中的“Mean 0.05,所以不能拒绝原假设,即认为总体的均值大于或等于52。2. 比例检验 检验总体中男女生比例是否相同,选单样本比例检验法,若p表示总体中男生的比例,则检验的是: H0:p = 0.5,H1:p 0.5; 步骤如下: (1) 选择菜单“Statistics(统计)”“Hypothesis Tes
18、ts(假设检验)”“One Sample Test for a Proportion(单样本比例检验)”,打开“One Sample Test for a Proportion”对话框; (2) 选中变量“SEX”,单击“Variable”按钮,将其移到“Variable”框中; (3) 单击“Level of Interest”下拉框右侧的下拉尖头,选M; 图3-12 比例检验 (4) 单击“OK”按钮,得到检验结果如图3-12所示。 显示的结果表明样本中男生的比例为0.5263,检验用的Z统计量的p为0.8185 0.05,所以接受原假设,总体中男女生比例无显著差异。3.3 总体参数比较3
19、.3.1 概述 上一节介绍了总体分布参数的比较,在实用中还常遇到另一类检验问题。例如学校中的男女生分别看为两个总体,希望检验男女生的身高或体重是否有显著差异。一个产品在生产过程中改变了原材料的配方或生产工艺,希望检验改变前后产品质量是否有显著差异。3.3.2 两独立样本的均值比较 对男女生身高体重比较和工艺改变前后质量的比较,可以用以下模型处理。若总体A和B分别是正态分布的,Xl,X2,Xn和Y1,Y2,Ym分别是总体A和B的独立样本,要检验的假设为: H0:m1 = m2,H1:m1 m2; 若原假设成立,和比较接近,|T|的值较小,所以|T|很大是稀有的极端情况。因而根据样本观测值计算得到
20、的统计量T的观测值t,可以求得p值,并与显著水平a比较而作出判断,这样的方法称为两样本t检验法。 SAS/INSIGHT未提供独立两样本均值检验的功能,Analyst中可以进行两样本t检验。 用分析员应用作参数比较: (1) 在分析员应用中,打开数据集SASUSER.CLASS; (2) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“Two-Sample t-test for Means(两样本均值t检验)”,打开“Two-Sample t-test for Means”对话框; (3) 选中变量HEIGHT,单击“Dependent”按钮,将其移到
21、“Dependent”框中;选中变量Sex,单击按钮“Group”,将其移到“Group”框中;此时可以看到有两个组:Sex = F和Sex = M,如图3-13所示; 图3-13 检验设置 若要得到m1 - m2的置信区间,可单击“Tests”按钮,在打开的“”对话框中选择“Interval”,如图3-13右所示; (4) 单击“OK”按钮,返回;再次单击“OK”按钮,得到检验结果如图3-14所示。图3-14 两样本均值t检验 在显示的结果中包括了方差相等和不等的两种情形,可以看到p值大于0.05,所以应该接受原假设,即男女生的身高无显著差异,从显示的均值之差的置信区间可以看到,以95的把握
22、,男女生的身高之差在-8.14到1.50的范围内。3.3.3 配对观测的均值比较 我们在现实中经常遇到同一总体两个测量结果的比较,比如,考察同一组人在参加一年的长跑锻炼前后的心率有无显著差异。这时,每个人一年前的心率和一年后的心率是相关的,心率本来较快的人锻炼后仍相对于其它人较快。所以,检验这样的成对总体的均值不能使用两样本t检验的方法,因为独立性条件不再满足。这时,我们可以检验两个变量间的差值的均值是否为零,这等价于检验两组测量值的平均水平有无显著差异。 例如,我们想知道数据集SASUSER.GPA中SATM和SATV这两门考试的成绩有无显著差异(SATM平均值为595.3,SASTV平均值
23、为504.6,我们希望知道差异是否显著)。因为这两个成绩是同一个学生的成绩,所以它们之间是相关的(学得好的学生两科一般都好,学得差的一般两科都差),不能用独立两样本的t检验,但可以计算两变量间的差DMV=SATM-SATV,检验差值变量的均值是否为零。如果否定,则可认为SATM和SATV的平均值有显著差异。 为了考察SATM和SATV这两门考试的成绩有无显著差异,检验假设: H0:m1 = m2,H1:m1 m2; 其中m1,m2分别表示SATM和SATV这两门考试成绩的均值。1. 用分析员应用作参数比较 (1) 在分析员应用中,打开数据集SASUSER.GPA; (2) 选择菜单“Stati
24、stics(统计)”“Hypothesis Tests(假设检验)”“Two-Sample Paired t-test for Means(两样本成对均值t检验)”,打开“Two-Sample Paired t-test for Means”对话框; (3) 选中变量satm,单击“Group1”按钮,将其移到“Group1”框中;选中变量satv,单击按钮“Group2”,将其移到“Group2”框中,如图3-15左所示; 图3-15 Analyst的成对t检验对话框 (4) 单击“Tests”按钮,在打开的“Two-Sample Paired t-test for Means:Tests”
25、对话框中,选中“Interval”后可以设定置信区间的要求,如图3-15右; (5) 两次单击“OK”按钮,得到检验结果,如图3-16所示。 显示的结果表明,t统计量的p值Pr| t |t|M|S|.0001,在0.05水平下是显著的,结论不变。所以这三个检验的结论都是两科成绩有显著差异。3.4 练习 1. 求均值的置信区间: 1) 用数据集SASUSER.AIR,求出变量CO均值95的置信区间; 2) 要把这一区间变窄应该如何做? 2. 对均值做假设检验:1) 要检验CO的均值是否为1.3,原假设和备选假设分别是什么?2) 做出检验,t统计量的值是什么?p值是什么?用a=0.05对原假设得到
26、什么结论? CO的均值与1.3是否有显著的差异?3) 检验CO的均值与2是否有显著的差异?3. 下表为某基础统计课程两次考试的学生成绩。 两次考试考同样的知识。试比较这两次考试难易程度有无显著差异。学号12345678910第一次93888988678983948955第二次98746792839074979681学号11121314151617181920第一次88918570909094678783第二次83948978969381819391 4. 为研究溶菌酶水平在患胃溃疡的病人与正常人之间有无显著差异,测量了一组病人和一组正常人的溶菌酶水平,结果见下表。是检验两者的溶菌酶水平有无显著
27、差异(水平0.05)。胃溃疡病人组:0.2 10.4 0.3 10.9 0.4 11.3 1.1 12.4 2.0 16.2 2.1 17.6 3.3 18.9 3.8 20.7 4.5 24.0 4.8 25.4 4.9 40.0 5.0 42.2 5.3 50.0 7.5 60.0 9.8 对照组:0.2 5.4 0.3 5.7 0.4 5.8 0.7 7.5 1.2 8.7 1.5 8.8 1.5 9.1 1.9 10.3 2.0 15.6 2.4 16.1 2.5 16.5 2.8 16.7 3.6 20.0 4.8 20.7 4.8 33.0 提示:要考虑分布是否正态。 5. 为了考察两种测量萘含量的液体层析方法:标准方法和高压方法的测量结果有无显著差异,取了10份试样,每份分为两半,一半用标准方法测量,一半用高压方法测量,每个试样的两个结果如下表,试检验这两种化验方法有无显著差异(水平0.05): 标准14.714.012.916.210.212.412.014.811.89.7高压12.110.913.114.59.611.29.813.712.09.1
链接地址:https://www.31doc.com/p-1986571.html