《spss频数分析.pdf》由会员分享,可在线阅读,更多相关《spss频数分析.pdf(15页珍藏版)》请在三一文库上搜索。
1、SPSS SPSS 主要介绍在主要介绍在 SPSS SPSS 中进行 频 数分析 ,交互分中进行 频数分析 ,交互分析,相关分析, 均值比较与检验,回归分析,相关分析,均值比较与检验, 回归分析,方差分析,等。析,方差分析,等。一、频 数分布表一、频数分布表在在 SPSS SPSS 中可以很容易 地得出频数分布表,平均数,中可以很容易地得出频数分 布表,平均数,标准差等。标准差等。频数分布:可以 概略地看到资料的分布情况,可做频数分布:可以概略地 看到资料的分布情况,可做初步整理之用,从中还可检查 数据输入情况。初步整理之用,从中还可检查数据输入情 况。 Analyze Analyze Des
2、criptive Statistics Descriptive Statistics Frequencies Frequencies 可 选入多个变量。可选入多个变量。General Happiness 467 30.8 31.1 31.1 872 57.5 58.0 89.0 165 10.9 11.0 100.0 1504 99.1 100.0 13 .9 1517 100.0 Very Happy Pretty Happy Not Too Happy Total Valid NA Missing Total Frequency Percent Valid Percent Cumulati
3、ve Percent Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total V alid NA Missing Total F requency Percent V
4、 alid Percent Cumulative Percent Statistics: Statistics: Dispersion( Dispersion(离差栏)离差栏) : Std.Deviation Std.Deviation标准差标准差Variance Variance 方差 方差 Range Range 全距 全距Minimum Maximum Minimum Maximum S.E.mean S.E.mean均数的标准误均数的标准误 Central Tendency ( Central Tendency (集中趋势栏)集中 趋势栏)Mean Median Mode Sum Me
5、an Median Mode Sum Skewness Skewness 偏度( 偏度(00, , 1.5 1.5 , , 0.5 0.5 , , -0.5 0.5 ) Kurtosis Kurtosis 峰度( 峰度(00,正,负) , 正, 负) 例: 例: 09 09- -01 01 Statistics 1509 1510 8 7 1.90 12.88 .045 .077 2.00 12.00 0 12 1.765 2.984 3.114 8.904 1.034 -.168 .063 .063 1.060 .710 .126 .126 8 20 0 0 8 20 2869 19455
6、Valid Missing N Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Number of Children Highest Year of School Completed Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14
7、.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total Valid NA Missing Total Frequency Percent Valid Percent Cumulative Percent 还可直接作出图 形: 还可直接作出图形:Charts: Charts: Bar charts: Bar charts: 条形图
8、条形图Pie Charts: Pie Charts: 圆图、饼图 圆 图、饼图 Histograms: Histograms:直方图。 只适用于连续的 直方图。只适用于连续的数值型变量。数值型变量。 Highest Year of School Completed 20.0 17.5 15.0 12.5 10.0 7.5 5.0 2.5 0.0 700 600 500 400 300 200 100 0 Std. Dev = 2.98 Mean = 12.9 N = 1510.00 Number of Children Eight or More 7 6 5 4 3 2 1 0 Missing
9、 C o u n t 500 400 300 200 100 0 二、描述统计分析过程二、描述统计分析过程对于定距 以上变量,可以进行集中趋势和对于定距以上变量,可以 进行集中趋势和离中趋势的统计离中趋势的统计Analyze Analyze Descriptive Descriptive Statistics Statistics Descriptives Descriptives 变量可多选变 量可多选其中选项有:其中选项有:Mean Std.deviation Mean Std.deviation Minimum Minimum Descriptive Statistics 1509 0
10、8 1.90 1.765 1510 0 20 12.88 2.984 1504 1 3 1.80 .617 1495 Number of Children Highest Year of School Completed General Happiness Valid N (listwise) N Minimum Maximum Mean Std. Deviation 三、探索分析三、 探索分析11、对数据进行初步考察:、对数据进行初步考 察: 检查数据是否有错误:过大或过小的数据有可能检查 数据是否有错误:过大或过小的数据有可能是奇异值、影 响点或错误数据。一要找出,二是奇异值、影响点或错误
11、 数据。一要找出,二要分析原因,三要决定是否从中剔除。 要分析原因,三要决定是否从中剔除。数据分布特征:许 多分析方法对数据的分布有一数据分布特征:许多分析方 法对数据的分布有一定要求。从数据是否服从正态分布, 决定他们定要求。从数据是否服从正态分布,决定他们是 否可以选用只对正态分布数据适用的分析方是否可以选用 只对正态分布数据适用的分析方法。 法。 Explore : Explore : 进行初步探索分析进行初步探索分析09 09-03 03 四、交互分析表四、交互分析表根据变量的层次,统 计学中有各种不同的根据变量的层次,统计学中有各种不 同的 相关系数来描述,在社调中常见的两个相关系数
12、来描 述,在社调中常见的两个定类(或一个定类、 一个定序)定 类(或一个定类、一个定序)Analyze Analyze Descriptive Descriptive Statistics Statistics Crosstabs Crosstabs 选择一个或多个变量进入选择一个或 多个变量进入Rows Rows 框,框, Column Column 对复 选框的解释对复选框的解释(1)Chi (1)Chi-square, square, 卡方检验。卡方检验。Pearson Chi Pearson Chi-square test square test Likehood ration Chi
13、 Likehood ration Chi-square test square test 似然比卡方检验似然比卡方 检验 Fisher Fishers exactly test s exactly test 费雪精确检 验 费雪精确检验(22)Correlation Correlation复选框。 复选框。Pearson,Spearman Pearson,Spearman(只适用于 数值 (只适用于数值型) 型) (3)Nominal Data (3)Nominal Data 栏,适用于定类变量栏,适用于定类变量的统计量。 的统计量。Lambda Lambda复选项复选项 ( (44) ) O
14、rdinal Data Ordinal Data栏:适用于定序变栏:适用于定序变量 的统计量量的统计量Gamma Kendall Gamma Kendall”s tau s tau-bb Kendall Kendall” s tau s tau-cc (5)Nominal by Interval: (5)Nominal by Interval:一个定类一一个定类一 个定距以上变量个定距以上变量Eta Eta 统计量,如收入和 性别的关联性统计量,如收入和性别的关联性Flag significant correlations: Flag significant correlations:用用 星
15、号标记有统计学意义的相关关系。星号标记有统计学意 义的相关关系。相关分析是研究变量间密切程度的一种统 计方法。相关分析是研究变量间密切程度的一种统计方法。 对于其数值可以从小到大排列的数据才能计算其对于其数 值可以从小到大排列的数据才能计算其相关系数。相关系 数。 11、对定距以上两个变量、对定距以上两个变量xx 与与 yy 的相关系数采用的相关系数采用Pearson Pearson 相关系数相关系数22、 Spearman Kendall Spearman Kendall 相关系数是一种非参测相关系数是一种非参测度, 是根据数据的秩而不是根据实际值计算的。度,是根据数 据的秩而不是根据实际值
16、计算的。适合定序数据或不满足 正态分布假设的定距数据。适合定序数据或不满足正态分 布假设的定距数据。33、偏相关系数:描述的是当控制了 一个 、偏相关系数:描述的是当控制了一个或几个另外的 变量的影响条件下两个变或几个另外的变量的影响条件下 两个变量间的相关性。如:可以控制年龄和工量间的相关 性。如:可以控制年龄和工作经验,估计工资收入与受教 育程度之作经验,估计工资收入与受教育程度之间的相关 关系。 间的相关关系。44、关于相关系数统计意义的检验: 由于 、关于相关系数统计意义的检验:由于抽样误差的存 在。检验的零假设抽样误差的存在。 检验的零假设 总总 体中两个变量间的关系为体中两个变量间
17、的关系为 00。 SPSS SPSS 只给出给假设成立的概率只给出给假 设成立的概率PP值。 值。 (11)Analyze Analyze Correlations Correlations Bivariate Bivariate 计算指定的两个变量之间的相关系数,可选择计算指定的 两个变量之间的相关系数,可选择Pearson Pearson 相关、 相关、 Spearman Spearman和和Kendall Tau Kendall Tau-bb 相关; 同时对相关系数进行检相关;同时对相关系 数进行检验。 验。 Test of Significance Test of Significan
18、ce 是用于变量间相关的是用于变量间相关的显著性检验。系 统默认的是双侧检验。显著性检验。系统默认的是双侧检 验。 Two Two-tailed: tailed:事先不知道相关方向事先不 知道相关方向One One-tailed: tailed:事先知道相关方向 事先知道相关方向例例 Data09 Data09-03 03 使用系统默 认值进行相关分析:使用系统默认值进行相关分析: Correlations 1 .661* . .000 474 474 .661* 1 .000 . 474 474 Pearson Correlation Sig. (2-tailed) N Pearson Co
19、rrelation Sig. (2-tailed) N Educational Level (years) Current Salary Educational Level (years) Current Salary Correlation is significant at the 0.01 level (2-tailed). *. 分 析:起始工资、现工资与雇员受教育水分析:起始工资、 现工资与雇员受教育水平、工作经验、职务等级之间是否 存在 平、工作经验、 职务等级之间是否存在线性关系。线 性关系。Descriptive Statistics 13.49 2.885 474 1.41
20、.773 474 $34419.57 $17075.661 474 $17016.09 $7,870.638 474 81.11 10.061 474 95.86 104.586 474 Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previous Experience (months) Mean Std. Deviation N Correlations 1 .514* .661* .633* .047 -.252* . .000 .000 .0
21、00 .303 .000 474 474 474 474 474 474 .514* 1 .780* .755* .005 .063 .000 . .000 .000 .908 .173 474 474 474 474 474 474 .661* .780* 1 .880* .084 -.097* .000 .000 . .000 .067 .034 474 474 474 474 474 474 .633* .755* .880* 1 -.020 .045 .000 .000 .000 . .668 .327 474 474 474 474 474 474 .047 .005 .084 -.
22、020 1 .003 .303 .908 .067 .668 . .948 474 474 474 474 474 474 -.252* .063 -.097* .045 .003 1 .000 .173 .034 .327 .948 . 474 474 474 474 474 474 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pear
23、son Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previous Experience (months) Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previou
24、s Experience (months) Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). *. Corr elations 1.000 .415* .568* .554* . .000 .000 .000 474 474 474 474 .415* 1.000 .519* .530* .000 . .000 .000 474 474 474 474 .568* .519* 1.000 .656* .000 .
25、000 . .000 474 474 474 474 .554* .530* .656* 1.000 .000 .000 .000 . 474 474 474 474 C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N Educational Lev el (y ears) Employ ment
26、C ategory Beginning Salary C urrent Salary Kendalls tau_b Educational Level (y ears) Employ ment C ategory Beginning Salary C urrent Salary C orrelation is significant at the .01 lev el (2-tailed). *. (22) Analyze Analyze Correlations Correlations Partial Partial 用上例:用上例:- Controlling for JOBCAT PRE
27、VEXP Controlling for JOBCAT PREVEXP JOBTIME JOBTIME SALARY EDUC SALARY EDUC SALARY 1.0000 .4399 SALARY 1.0000 .4399 ( 0) ( 469) ( 0) ( 469) P= . P= .000 P= . P= .000 EDUC .4399 1.0000 EDUC .4399 1.0000 ( 469) ( 0) ( 469) ( 0) P= .000 P= . P= .000 P= . (Coefficient / (D.F.) / 2 (Coefficient / (D.F.)
28、/ 2-tailed Significance) tailed Significance) “ . “ is printed if a coefficient cannot be “ . “ is printed if a coefficient cannot be computed computed 回归分析是处理两个及两个以上变量间线性依存回归分析 是处理两个及两个以上变量间线性依存关系的统计方法。 关系的统计方法。回归分析作为一个严肃的统计学模 型,有着严格回归分析作为一个严肃的统计学模型,有着 严格 的使用条件。因此在做回归分析之前,应该对数的使 用条件。因此在做回归分析之前,应该对数
29、据进行基本的 判断。如作出散点图、观察变量间据进行基本的判断。如 作出散点图、观察变量间的趋势等。的趋势等。 Analyze Analyze Regression Regression Linear Linear 因变量,只选一个因 变量,只选一个自变量, 可选入多个自变量。自变量, 可选入多个自变量。Method: Method: 对自变量的选入方法。对自变量的选入方法。 Enter: Enter: 强行进入法强行进入法Forward Forward :向 前选择法: 向前选择法Backward Backward : 向后剔除法: 向后剔除法Stepwise Stepwise :逐步进入法:
30、逐步进入法 (例,及解释)(例,及解释)先做散点图:先做散点 图: 09 09-03 03 Graphs Graphs- -scatter scatter Variables Entered/Removed b Educational Level (years) a . Enter Model 1 Variables Entered Variables Removed Method All requested variables entered. a. Dependent Variable: Current Salary b. Model Summary .661 a .436 .435 $1
31、2,833.540 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Educational Level (years) a. ANOVA b 6.018E+10 1 60178217760 365.381 .000 a 7.774E+10 472 164699740.8 1.379E+11 473 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Co
32、nstant), Educational Level (years) a. Dependent Variable: Current Salary b. 剩余变差: 剩余变差:YY 值对于回归直线的偏差。 值对于回归直线的偏差。回归变差:回归已知时误差减少 的量。回归变差:回归已知时误差减少的量。总变差总 变差 = 剩余变差剩余变差 + 回归变差回归变差总平方 和 总平方和 = 未解释的平方和未解释的平方和+ 已解释 的平方已解释的平方和和 Coefficients a -18331.18 2821.912 -6.496 .000 3909.907 204.547 .661 19.115 .00
33、0 (Constant) Educational Level (years) Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Dependent Variable: Current Salary a. 扩展 扩展 几个自变量的线性回归示例:几个自变量的线性回归示 例: 如:现工资与受教育水平、初始工资、工作如:现工 资与受教育水平、初始工资、工作经验、职位之间的回归 模型。 经验、职位之间的回归模型。Coef ficients a -21023.6 3942.120 -
34、5.333 .000 2065.544 173.285 .349 11.920 .000 13260.69 645.815 .600 20.533 .000 109.232 42.626 .064 2.563 .011 (Constant) Educational Level (y ears) Employ ment Category Months since Hire Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Dependent Variable: Curren
35、t Salary a. 均值不相等的 两个样本不一定来自均值不同均值不相等的两个样本不一 定来自均值不同的总体;两个变量均数接近的样本是否来 的总体;两个变量均数接近的样本是否来自均值相同的总 体? 自均值相同的总体? 两个样本某变量两个样 本某变量均值不同, 其差异是否具有统计意义。均值不同, 其差异是否具有统计意义。对调查样本中不同的子总体在 某些变量上的对调查样本中不同的子总体在某些变量上的 平均值之间的差异情况进行比较。平均值之间的差异情况 进行比较。主要是对样本的描述统计, 也直 主要是对样本的描述统计,也直接进行比较。接进 行比较。-Samples T Test: Samples
36、T Test: 样本均值和已知样本均值和已知 Independent-Samples T Test: Samples T Test:独立独立 样本均值差比较样本均值差比较 Paired-Samples T Test: Samples T Test:配对样本配对样 本 One One- -way ANOVA: way ANOVA:用于检验几个独立 的 用于检验几个独立的组是否来自均值相同的总体。组 是否来自均值相同的总体。问:检验男生和女生的学习成 绩是否有显问:检验男生和女生的学习成绩是否有显著性 差异?著性差异?检验丈夫和妻子的智商是否有显著性 差异?检验丈夫和妻子的智商是否有显著性差异?方
37、差 齐次检验:方差齐次检验: FF 一、 一、 Means Means 过 程 过程 Analyze Analyze Compare Means Compare Means Means Means 例:例: 09 09- -03 03男女工 资均值男女工资均值Report Current Salary $26031.92 216 $7,558.021 $41441.78 258 $19499.214 $34419.57 474 $17075.661 Gender Female Male Total Mean N Std. Deviation 职位不同的男女雇员工资的均值职位不同的男 女雇员工资
38、的均值Report Current Salary $25003.69 206 $5,812.838 $47213.50 10 $8,501.253 $26031.92 216 $7,558.021 $31558.15 157 $7,997.978 $30938.89 27 $2,114.616 $66243.24 74 $18051.570 $41441.78 258 $19499.214 $27838.54 363 $7,567.995 $30938.89 27 $2,114.616 $63977.80 84 $18244.776 $34419.57 474 $17075.661 Emplo
39、yment Category Clerical Manager Total Clerical Custodial Manager Total Clerical Custodial Manager Total Gender Female Male Total Mean N Std. Deviation 二、 单样本二、单样本TT 检验 检验Analyze Analyze Compare Means Compare MeansOne One- Samples T Test Samples T Test 例:已知某地例:已知某 地 12 12 岁男孩身高岁男孩身高142.3cm 142.3cm, 现
40、 测得某市现测得某市120 120 名名 12 12 岁男孩身高资料。 岁男孩身高资料。11 11-02 02 在在 Test Test 中输入中 输入 142.3 142.3 One-Sample Statistics 120 143.048 5.8206 .5313 12岁男孩身高N Mean Std. Deviation Std. Error Mean One-Sample Test 1.408 119 .162 .748 -.304 1.800 12 岁男孩身高t df Sig. (2-tailed) Mean Difference Lower Upper 95% Confidence
41、 Interval of the Difference Test Value = 142.3 三、独立样本三、独立样本 TT 检验 检 验 要求被比较的两个样本彼此独立,没有配要求被比较的 两个样本彼此独立,没有配对关系。要求两个样本均来自 正态总体。对关系。要求两个样本均来自正态总体。例: 检验男女雇员现工资是否有显著性差例:检验男女雇员现 工资是否有显著性差异。 异。 09 09-03 03 Analyze Analyze Compare Means Compare Means Independent Samples T Test Independent Samples T Test Gr
42、oup Statistics 258 $41441.78 $19499.214 $1,213.968 216 $26031.92 $7,558.021 $514.258 Gender Male Female Current Salary N Mean Std. Deviation Std. Error Mean Independent Samples Test 119.669 .000 10.945 472 .000 $15,409.86 $1,407.906 $12643.32 $18176.40 11.688 344.262 .000 $15,409.86 $1,318.400 $1281
43、6.73 $18003.00 Equal variances assumed Equal variances not assumed Current Salary F Sig. Levenes Test for Equality of Variances t df Sig. (2-tailed) Mean Difference Std. Error Difference Lower Upper 95% Confidence Interval of the Difference t-test for Equality of Means 四、配对样本四、 配对样本 TT 检验检验 要求被比较的两个样本有配对关系。 两个 要求被比较的两个样本有配对关系。两个样本均来自 正态总体。均值对于检验是样本均来自正态总体。均值对 于检验是有意义的描述统计量。有意义的描述统计量。 例: 例: 10 10 个高血压患者在施以体育疗法前后个高血 压患者在施以体育疗法前后测定舒张压。要求判断体育疗 法对降低测定舒张压。要求判断体育疗法对降低血压是否 有效。 血压是否有效。 11 11-03 03 零假设:零假设:自 己在电脑上进行操作,将频数分析 、交互自己在电脑上进 行操作,将 频数分析 、交互分析、相关分析、回归分析、 均数检验等分析、相关分析、回归分析、均数检验等熟悉 一遍。熟悉一遍。
链接地址:https://www.31doc.com/p-4741574.html