社会经济统计软件应用-SPSS应用.ppt
《社会经济统计软件应用-SPSS应用.ppt》由会员分享,可在线阅读,更多相关《社会经济统计软件应用-SPSS应用.ppt(37页珍藏版)》请在三一文库上搜索。
1、社会经济统计软件应用SPSS应用,第3章 基本统计分析功能,基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。 基本统计分析指的是Analyze菜单下的报告分析(Report)和描述性统计分析(Descriptive Statistics)两项功能。,SPSS的许多模块均可完成统计描述的任务,除各种用于统计推断的过程会附带进行相关的统计描述外,SPSS还专门提供了几个用于连续变量统计描述的过程,它们均集中在Descriptive Statistics子菜单中,主要包括: Frequenci
2、es 频数分析 Descriptives 描述性分析 Explore 探索性分析 Crosstabs 列联表分析,1.基本统计量的定义及计算 2.描述性分析(Descriptives) 3.频数分析(Frequencies) 4.探索性分析(Explore),1.基本统计量的定义及计算,数据的特征,1.1 描述集中趋势的统计量,集中趋势是数据分布的一个特征,反映各变量值向其中心值聚集的程度。 主要指标 均值(Mean) 中位数(Median) 众数(Mode) 截尾均数 几何均数 调和均数,均值(Mean),均值(Mean)又称为“算术平均值”,指一组数的平均值,其数学定义为: 特点: 最常用
3、的测度值 均值利用了全体数据 易受数据中极端值的影响(如去掉最高、最低分) 用于数值型数据,而不能用于定类数据和定序数据,中位数(Median),中位数(Median)是一组数据按大小排序后,处于中间位置上的数值。 个数为奇数取中间数 为偶数,取中间两数的平均值 特点: 不受极端值的影响 主要用于定序数据,也可用于数值型数据,但不能用于分类数据。,众数(Mode),众数(Mode)是样本中出现次数(频数)最多的数值。 特点: 不受极端值的影响 可能没有众数或有几个众数(不唯一性) 主要用于分类数据,也可用于顺序数据或数值型数据,其它,截尾均数 由于均数较易受极端值的影响,因此可以考虑将数据进行
4、排序后,按照一定比例去掉最两端的数据,只使用中部的数据来求均数。 常用的截尾均数有5截尾均数,即两端各去掉5的数据。在SPSS 中Explore过程可以自动计算5截尾均数。,几何均数 几何均数适用于原始数据分布不对称,但经过对数转换后呈对称分布的资料。样本几何均数常用G表示,其计算公式为: 调和均数 调和均数用符号H表示,是观察值倒数之均数的倒数,其计算公式为:,1.2 描述离散程度的统计量,数据的离散程度就是各数据远离其中心值的程度,反映数据的波动情况,因此也称为离中趋势。 主要指标 方差(Variance) 标准差(Stddeviation) 极差(全距)(Range) 离散系数(Coef
5、ficient of Variation) 百分位数、四分位数与四分位数间距,方差(Variance),方差(Variance)是各变量值与其均值离差(deviation about the mean)平方的平均数。 总体方差(Population Variance)用2表示: 样本方差(Sample Variance)用S2表示: 特点: 最常用的离散程度的统计量,方差越大,表明样本偏移样本平均值的程度就越大,标准差(Stddeviation),标准差(Stddeviation)是方差开方后的统计量 总体标准差用表示: 样本标准差用S表示: 特点: 标准差与原始数据具有相同的量纲 标准差和方
6、差一样,也是度量离散程度的重要统计量 比方差更常用,均值标准误差(Standard Error of Mean),均值标准误差(Standard Error of Mean)是样本均值的标准差。 特点: 反映均值的离散程度,极差(全距)(Range),极差(全距)(Range)是一组数据的最大值与最小值之差。是最简单的测度离散程度的指标。 特点: 极差易受极端值(最大值和最小值)的影响 由于极差只利用了数据两端的信息,没有反映中间数据的离散状况,因而不能准确描述数据的离散程度,离散系数(Coefficient of Variation),离散系数(Coefficient of Variatio
7、n)又称标准差系数,是标准差与相应均值之比。 特点: 用于测量相对离散程度 离散系数消除了数据水平高低和计量单位的影响,用于对不同组别离散程度进行比较,百分位数、四分位数与四分位数间距,百分位数(Percentile Value)是一种位置指标,用Px表示。将样本数据按升序排列后,排在前面x的数据的右端点值称为样本的x分位数。 P50中位数 四分位数(Quartiles)实际上是三个数值的总称,分别是P25、P50和P75分位数。这三个分位数正好是能够将全部总体单位按标志值的大小等分为四部分的三个数值,符号分别记为Ql、Q2和Q3。在许多统计书籍中,也将第一个四分位数P25称为“下四分位数”;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会经济 统计 软件 应用 SPSS
链接地址:https://www.31doc.com/p-2666928.html