spss练习题及简答要点.pdf
《spss练习题及简答要点.pdf》由会员分享,可在线阅读,更多相关《spss练习题及简答要点.pdf(23页珍藏版)》请在三一文库上搜索。
1、SPSS练习题 1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文 件以学号为关键变量进行横向合并,形成一个完整的数据文件。先排序 data-sort cases再合 并 data-merge files 2、有一份关于居民储蓄调查的数据存储在EXCEL 中,请将该数据转换成SPSS数据文件, 并在 SPSS中指定其变量名标签和变量值标签。转换 Data-transpose,输题目 3、利用第2 题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心 繁华城市” 且本次存款金额在1000-2000 之间的调查数据,第二份数据文件是按照简单随机 抽
2、样所选取的70%的样本数据。 选取数据 data-select cases 4、利用第2 题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重 排序。 排序 data-sort cases一个一个选,加 5、根据第1 题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的 降序排序。 计算 transform-count 按个输,把所有课程选取,define 设区间,再排序 6、根据第1 题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各 科成绩的平均分。描述性统计,先转换Data-transpose 学号放下面,全部课程(poli 到 his
3、) 放上面, ok, analyze-descriptive statistics-descriptives , 全选,options。 先拆分 data-split file 按性别拆分, analyze-descriptive statistics-descriptives全选所有课程options-mean 7、利用第2 题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组 距分组。数据分组Transform-recode- 下面一个, 输名字,change, old, range, new value-add 挨个输,从小加到大,等距 8、在第 2 题的数据中,如果认为
4、调查“今年的收入比去年增加”且“预计未来一两年收入 仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能 找到这些人。 (计算 transform-count 或) 选取 data-select cases 9、利用第2 题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘 制条形图。 Analyze- descriptive statistics-frequencies 10、利用第 2 题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次 存款金额的基本特征,并与标准分布曲线进行对比,进一步, 对不同常住地住房存款金额的 基本特
5、征进行对比分析。An DS d Analyze-Descriptive Statistics-Descriptives, 选择存款金额到Variable(s)中。按Option,然后选择 Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variable list.然后按 continue , ok 11、将第 1 题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些 课程的平均差异不显著。 Transform compute 课程平均分 =mean() analyze-comp
6、are means-independent-samples T;选择若干变量 作为检验变量到test variables 框(课程平均分) ;选择代表不同总体的变量(sex)作为分组变量到grouping variable 框; .定义分组变量的分组情况Define Groups.: (填 1,2) 。1.两总体方差是否相等F 检验: F 的统 计量的观察值为0.257,对应的 P 值为 0.614,;如果显著性水平为0.05,由于概率P 值大于 0.05,两种方式的方差 无显著差异 .看 eaual variances assumend 。2.两总体均值的检验:.T 统计量的观测值为-0.5
7、73,对应的双尾概 率为 0.569,T 的 P值显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。 配对差异 :analyze-compare means-paired-samples Tpaired variables 框中每科与不同科目配对很麻烦略 12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为 75,现从雇员中随机随出11 人参加考试,得分如下:80、 81、72、60、 78、65、56、79、 77、 87、76,请问该经理的宣称是否可信? 步骤:采用单样本T检验( 原假设H0:u=u0, 总体均值与检验值之间不存在显著差异
8、.) ;菜单选项: Analyze-compare means-one-samples T test; 指定检验值 :在 test 后的框中输入检验值(填 75) , 最后 ok!分析: N=11 人的 平均值( mean)为 73.7,标准差( std.deviation)为 9.55,均值标准误差(std error mean)为 2.87.t 统计量观测值为-4.22,t 统计量观测值的双尾概率p-值( sig.(2-tailed))为 0.668,六七列是总体均值与原假 设值差的95%的置信区间 ,为 (-7.68,5.14),由此采用 双尾检验比较a 和 p。T 统计量观测值的双尾概
9、率p-值 (sig.(2-tailed) )为 0.668a=0.05 所以不能拒绝原假设;且 总体均值的95%的置信区间 为(67.31,80.14),所以 均值在 67.3180.14 内 ,75 包括在置信区间内,所以经理的话是可信的。 13、 利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图, 并利用LSD 方法进行多重比较检验。单因素方差分析对比图为options 中的 descriptives LSD 为 post中的P值大于 a 接受所以无关 14、已知 240 例心肌梗塞患者治疗后24 小时内的死亡情况如表1 所示,问两组病死亡率相 差是否显著?(e
10、xample1.sav) (显著性水平为5%) 表 1:急性心肌梗塞患者治疗后24 小时生死情况 生存死亡 用单参注射液187 11 未用单参注射液36 6 合计223 17 提出假设: H 0 :是否接受治疗的急性心肌梗塞患者的病死率相差不显著 H 1:是否接受治疗的急性心肌梗塞患者的病死率相差显著 操作步骤: 1、打开数据文件:file opendataexample1.sav 2、对 count 变量进行weight cases 处理: dataweight cases 选中 weight cases by;在Frequencies variable 中加入变量count。 3、对数据进
11、行交叉汇总,如得出的下列频次交叉表,如图表31: 用 descriptive-cross tab 过程, column 填 status, row 填 group。 在 cell 选项中,选中percentages ,以计算频数百分比。 统计表格及分析: 表31 是否接受治疗与生存状况的相关性检验成果表(Chi-Square Tests) Value df Asymp. Sig. (2-sided) Pearson Chi-Square 6.040(b) 1 .014 Linear-by-Linear Association 6.015 1 .014 有效个案数240 表 31 是相关性卡方检
12、验成果表。表中依次列出了Pearson 卡方系数、线性相关的值 (Value ) 、自由度( df)和双尾检验的显著水平(Asymp. Sig. (2-sided)) 。 表 32 显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存 和死亡状况频数和所占总数的百分比。 表 32 急性心肌梗塞患者是否治疗与生死情况的列联表 状况 (status) 总数 生存死亡 分组 (group) 用单参注射液Count 185 10 195 % within 分组 (group) 94.9% 5.1% 100.0% 未用单参注射液Count 38 7 45 % within 分组 (gro
13、up) 84.4% 15.6% 100.0% 总数Count 223 17 240 % within 分组 (group) 92.9% 7.1% 100.0% 结论: 根据表 31 可以看出,双侧检验的显著性概论为0.014 ,小于显著性水平0.05;因此 否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。 15、已知数据如表2 所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺 等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别? (example2.sav)(显著性水平为5%) 表 2:两化疗组的缓解率比较 治疗组缓解未缓解合计 单纯化疗2
14、10 12 复合化疗14 13 27 合计16 23 39 同上小于拒绝显著 16、已知数据如表3 所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成 比有无差别? (example3.sav)(显著性水平为5%)同上小于拒绝显著 表 3:我国南北方鼻咽癌患者病理组织学分类构成 地域淋巴上皮癌未分化癌磷癌其他合计 南方四省71 6 16 18 111 东北三省89 18 22 51 180 合计160 24 38 69 291 17、已知97 名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的 儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
15、 1、打开数据文件:file opendatachild.sav 2、均值比较与检验:Analyze Compare means means 3、在 independent Var. 中选性别, dependent Var. 中选体重和身高 4、在 option子框中选择 median/mean/Std. Deviation 1、男性儿童的平均身高为109.962 厘米;平均体重为18.202 千克;中位身高为109.10 厘 米;中位体重为17.50 千克;身高的标准差为6.084 厘米;体重的标准差为2.786 千克。 2、女性儿童的平均身高为109.896 厘米;平均体重为18.389千
16、克;中位身高为109.450 厘米; 中位体重为17.750 千克; 身高的标准差为5.770 厘米; 体重的标准差为3.235 千克。 3、两性儿童的平均身高为109.930 厘米;平均体重为18.292千克;中位身高为109.250 厘米; 中位体重为17.605 千克; 身高的标准差为5.905 厘米; 体重的标准差为2.995 千克。 18、已知 97 名被调查儿童体检数据文件为child.sav ,请问儿童的身高与体重是否分别 受到性别与年龄的影响?(显著性水平为5%) 提出假设: 1、H0:身高与体重受到年龄的影响不显著 H1:身高与体重受到年龄的影响显著 2、H0:身高与体重受到
17、性别的影响不显著 H1:身高与体重受到性别的影响显著 操作步骤: 1、 打开数据文件:file opendatachild.sav 2、 均值比较与检验:analysiscompare means means 3、 在 independent Var. 中选性别和年龄,dependent Var. 中选体重和身高 4、 在 option 子框中选择median/mean/ Std. Deviation 在 statistic for first layer 区域内勾上ANOVA table and eta 复选框 统计表格及分析: 表71 体重、身高与年龄的方差分析表 Sum of Squar
18、es df Mean Square F Sig. 体重 (x4,kg) * 年龄 (age) Between Groups 286.215 2 143.107 23.518 .000 Within Groups 565.918 93 6.085 Total 852.133 95 身高 (x5,cm) * 年龄 (age) Between Groups 1757.707 2 878.853 52.567 .000 Within Groups 1554.855 93 16.719 Total 3312.562 95 在表 71中,分别列出了平方和 (Sum of Squares) 、 自由度(df
19、) 、 均方差(Mean Square) 、 F值以及 F值的显著性水平(Sig.)。 F对应的概率值P(sig) (0.05 );故拒绝原假 设 ,接受备择假设,即身高与体重受到年龄的影响显著。 表72 体重、身高与性别的方差分析表 df Mean F Sig. Square 体重 (x4,kg) * 性别 (x2) Between Groups 1 .839 .093 .762 Within Groups 94 9.056 Total 95 身高 (x5,cm) * 性别 (x2) Between Groups 1 .105 .003 .956 Within Groups 94 35.23
20、9 Total 95 在表 7 2中, F对应的概率值P(sig) ( 0.05 );故接受原假设, 即身高与体重受 到性别的影响不显著。 19、文件 example.sav 中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受 专业训练后同学们的铁饼成绩有无显著提高?(显著性水平为5%) 统计表格及分析: 表81 配对样本的相关性分析表 N Correlation Sig. Pair 1 铁饼(训练前)& 铁饼(训练后) 24 .976 .000 H 0: 铁饼(训练前)和 铁饼(训练后)的数据之间不存在线性关系 H 1: 铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系 表81
21、列出了配对样本的个数(N)、相关系数( Correlation )、显著性概率(Sig. )。 显著性概率趋近于0,远小于 0.05 ,所以认为铁饼(训练前)和铁饼(训练后)的数据之间 存在线性关系。 表82 配对样本 T检验的成果表 Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 铁饼(训练 前) - 铁饼 (训练后) -.2417 .4323 .0882 -.4242
22、 -.0591 -2.739 23 .012 表8 2中为铁饼(训练前)和铁饼(训练后)的数据的T检验结果。表中前4项分别 为配对样本数据差异的均值(Mean ) 、 标准离差( Std. Deviation ) 、 均值的标准差 (Std. Error Mean ) 以及 95置信区间。 后3项为 t值 (t) 、 自由度(df) 和双尾显著性概率 ( Sig. (2-tailed) ) 。 表中双尾显著性概率为0.012 ,远小于 0.05 ,故拒绝原假设,接受备择假设,认为配 对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩提高显著。 结论: 铁饼(训练前)和铁饼(训练后)的数据之
23、间存在线性关系。且配对样本之间有显著 差异,即接受专业训练后同学们的铁饼成绩有显著提高。 20、文件 example.sav 中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩 (英文 +中文)之间有无显著差异?(显著性水平为5%)做法: 先计算出总成绩,计算方 法: Transform 菜单栏下的Compute Variable 选项 总成绩计算出来之后,选择Analyze 选项下 Compare Means 选项下“两独立样本T 检验” 选项卡 将总成绩放入Test Variable 一栏中,性别放入Grouping Variable 一栏中并为其定义。 点 Ok 即可得出结果。
24、结果分析:方差齐次性,采用F 检验, 0.235,大于 0.05,所以认为男女生总成绩两样本的 的方差是没有显著性差异的; 校正 t 检验的显著性水平Sig( 2-tailed)为 0.951,大于 0.05,所以男女生总成绩之间 没有显著性差异。 21、根据以往的资料,学生中文的平均成绩为80 分。文件 example.sav 中列出了某学校四个 年级学生的中文成绩,问学生中文成绩有无显著的下降?(显著性水平为5%) 提出假设: H 0 :50(-50=0);即学生中文成绩无显著的下降。 H 1:50(-50 0);即学生中文成绩有显著的下降。 操作步骤: 1、 打开数据文件:file op
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 练习题 要点
链接地址:https://www.31doc.com/p-5198191.html