《ch方差分析II不平衡设计.ppt》由会员分享,可在线阅读,更多相关《ch方差分析II不平衡设计.ppt(11页珍藏版)》请在三一文库上搜索。
1、【教育类精品资料】,上海财经大学统计与管理学院,方差分析-不平衡设计,问题和数据描述 研究澳洲儿童入学出勤情况影响因素。土著与白人儿童是否有差异?以所在学期逃学的天数研究出勤率。 方法介绍 不平衡数据析因设计,一类、三类偏差平方和 参考资料 汪仁官,陈荣昭(译),蒙哥马利(著),1998,实验设计与分析,中国统计出版社。 SAS分析 glm过程,版权所有:吴纯杰,广义线性模型(不平衡数据的方差分析),数据描述,数据描述 澳洲儿童土著与白人之间的上学出勤率比较研究。 数据集:ozkids 变量: cell- 单元号,不同水平组合 origin A土著,N白人 sex M男,F女 grade F0
2、小学最后一年级,F1-F3中学一年级至三年级 type Sl差生,Al一般生 days absent 学年旷课天数 问题提出 出勤率是否与不同人群、年级等因素有关?,上海财经大学统管院,统计模型,上海财经大学统管院,数据描述,上海财经大学统管院,共154条观测,各水平分组数不等,数据录入和整理,data ozkids; /* Chapter 6 */ infile d:ozkids.dat dlm= , expandtabs missover; input cell origin $ sex $ grade $ type $ days ; do until (days=.); output;
3、input days ; end; input; run;,上海财经大学统管院,注:expandtabs将tab制表符转换为空格处理,missover当前数据行不够分配余下变量时,则未分配的变量定义为缺失值处理;dlm= ,间隔符号接受空格或逗号。若去掉missover选项,结果如何?为什么? 注:理解do until直到型循环.当条件成立时,退出。 注:通过第二个input days语句录入当前行余下的数据。 注:最后的input释放当前行,转入到下一行接收新数据。若去除该语句,运行结果是否有变化?为什么?,一类和三类偏差平方和,上海财经大学统管院,一类和三类偏差平方和,上海财经大学统管院,
4、注:二类平方和为添加所有效应后的模型平方和与剔除该因子的模型平方和的差异。这里的三类等价于二类,主效应的方差分析模型,proc glm data=ozkids; class origin sex grade type; model days=origin sex grade type /ss1 ss3; run; proc glm data=ozkids; class origin sex grade type; model days=grade sex type origin /ss1; run; proc glm data=ozkids; class origin sex grade ty
5、pe; model days=type sex origin grade /ss1; run; proc glm data=ozkids; class origin sex grade type; model days=sex origin type grade /ss1; run;,注:一类平方和与建模的因子顺序有关,三类平方和则不受影响。 注: 结果显示origin和grade因子对旷课天数有显著差异影响。 注:最后因子type的一类和三类平方和结果相等。,上海财经大学统管院,含交互效应的方差分析模型,proc glm data=ozkids; class origin sex grade type; model days=origin sex grade type origin|sex|grade|type /ss1 ss3; run;,注:model语句为先做主效应,再分别进行交互效应分析。 注:结果显示SS1方法多个因子主效应和交互效应显著,但SS3方法结果无主效应显著,有少数交互效应显著,两者结果并不一致。 注:需要进一步分析,参见第九章广义线性模型的深入研究,使用旷课天数服从Poisson分布和联系函数为logistic函数的广义线性模型。进一步研究可以发现四个因子都有显著影响。,上海财经大学统管院,作业5,习题6.1-6.4,上海财经大学统管院,
链接地址:https://www.31doc.com/p-2891337.html