第讲描述性统计.ppt
《第讲描述性统计.ppt》由会员分享,可在线阅读,更多相关《第讲描述性统计.ppt(50页珍藏版)》请在三一文库上搜索。
1、SPSS统计软件,姓 名:曹玉茹 电 话:67703852 E - mail: 答疑地点:学院楼B418 答疑时间:,商务信息学院计算机教学部,上节回顾,一、数据的编码、录入与整理 二、数据问卷与编码 三、编码类型 四、缺失值的处理 五、数据处理中的操作术语 六、定义变量 七、数据的录入 八、数据的导入 九、数据的整理 分值转换、量表统分、排序、限选、加权、计数、合并于聚合,第2讲 描述性统计分析,一、描述性统计分析概念,目的 通过变量的描述性统计分析,能够掌握和了解样本数据的统计特征和总体分布形态,进而更深入地揭示变量变化的统计规律。 方法 数据计算:计算常见的描述性统计量的值,准确反映样本
2、数据的统计特征。 图形绘制:绘制常见的统计图形,通过图形来直观展现数据的分布特征,比较 数据分布的异同。 通常,两种方法混合使用。 SPSS软件中相关的7种功能 频数分析(Frenquencies): 描述统计量(Descriptives): 探索性分析(Explore): 交叉列联表(Crosstabs): 比率分析(Ratio): P-P图 Q-Q图,频数分析,二、频数分析,概念 统计的是每一组中观测点的个数,而不考虑其实际取值。 了解变量取值的一般特征。如,哪些数值出现的频率高?变量取值的大致范围是什么? 考察数据是否符合要进行的统计分析的假设。如:样本数足够大吗?每个变量的观测值是否合
3、理呢? 评估数据的质量。如,有多少缺失值或者有多少数据录入错误?,二、频数分析,SPSS中的频数分布表 频数分析的基本功能之一:是编制频数分布表,以下是几个频数分析时常用的概念: 频数(Frenquency):变量值落在某个区间或者某个取值点的个数。 百分比(Percent):各频数占总样本数的百分比。 有效百分比(Valid Percent):各频数占有效样本数的百分比。 累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。,二、频数分析,频数分析中的统计图 频数分析的基本功能之二:是绘制统计图,统计图能非常清晰直观地展示变量的取值状况,包括以下
4、三种图: 条形图(Bar Chart): 饼图(Pie Chart): 直方图(Histograms):,条形图与直方图区别,条形图 1. 用条形的长度表示各类别频数的多少, 其宽度是固定的 2. 各矩形通常是分开排列的; 3. 主要用于展示分类数据。 直方图 1. 用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率 宽度表示各组的组距; 2. 由于分组数据具有连续性,各矩形通常是连续排列; 3. 主要用于展示数值型数据。,二、频数分析,SPSS操作及案例 例一:各门成绩统计 结果保存为:3-StudentScore.spo,二、频数分析,SPSS操作及案例(数据文件:3Student
5、Score.sav) Analyze Descriptive StatisticsFrequencies,SPSS操作及案例(数据文件:3StudentScore.sav) 例二:语文成绩区间频度分布表 步骤1:对“语文”成绩进行分段 Transform Recode Into Different Variables (结果保存为:3-StudentScore_成绩分段.sav),二、频数分析,二、频数分析,SPSS操作及案例 步骤2:对“分数分段”进行统计 Analyze Descriptive Statistics Frequencies,二、频数分析,SPSS操作及案例,二、频数分析,S
6、PSS操作及案例 输出三门成绩的均值、标准差 极差及4分位数,基本描述统计量,三、基本描述统计量,概念 通过频数分析对数据的总体分布状况有了基本了解之后,通常还需要对定距变量的分布特征有更为精确的认识,这就需要通过计算基本描述统计量等途径来实现。 常见的描述统计量大致可以分为三类: 第一类:描述集中趋势(Central Tendency)的统计量 第二类:描述离散趋势(Dispersion)的统计量 第三类:描述分布形态(Distribution)的统计量,变量的值之间可以比较大小, 两个值的差有实际意义,这样 的变量叫定距变量。在调查被 访者的“年龄”和“每月平均收入”, 都是定距变量。,三
7、、基本描述统计量,描述集中趋势的统计量 指一组数据向某一中心集中的程度,即在某一中心附近观测值数目较多,远离该中心的观测值数目较少。有如下统计量: 平均值(Mean):即算术平均值(X1+X2+Xn)/n)。 易受极端值影响。 中位数(Median):把变量的值有序排列,位于中间位置的值即中位数。 是位置平均置,不易受极端值的影响。 众数(Mode):样本中出现次数最多的值,代表数据的集中程序。 求和(Sum):所有变量之和,反映变量的总体水平。,三、基本描述统计量,描述离散趋势的统计量 与“集中趋势”相反,“离散趋势”反映的是一组资料中各个观察值之间的差异或离散程度。即考察所有数据相对于“中
8、心值”分布的疏密程度。有如下统计量: 方差(Variance): 样本方差越大,说明变量值之间的差异越大,样本方差没有单位。 标准差(std. deviation): 样本标准差越大,说明变量的观测值之间 的差异越大,距离均值这个“中心”的离散程 度越大。,三、基本描述统计量,描述离散趋势的统计量 极差(Range):也称全距或跨度或范围,R最大值最小值 极差不考虑最大值与最小值之间的观测值,仅仅依靠端点值来确定,因而稳定性差。 最小值(Minimum):一组资料中各个观测值的最小者。 最大值(Maximum):一组资料中各个观测值的最大者。 均值标准误差(S.E.Mean,Standard
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 统计
链接地址:https://www.31doc.com/p-2572731.html