第3章数据的整理与图表展示.ppt
《第3章数据的整理与图表展示.ppt》由会员分享,可在线阅读,更多相关《第3章数据的整理与图表展示.ppt(77页珍藏版)》请在三一文库上搜索。
1、第 3 章 数据的整理与图表展示,第 3 章 数据的整理与图表展示,3.1 数据的预处理 3.2 品质型数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表,学习目标,了解数据预处理的内容和目的 掌握品质型数据的整理与显示方法 掌握数值型数据的整理与显示方法 用Excel作频数分布表和图形 合理使用图表,3.1 数据的预处理,3.1.1 数据审核 3.1.2 数据筛选 3.1.3 数据排序 3.1.4 数据透视表,数据的预处理,数据审核 检查数据中的错误 数据筛选 找出符合条件的数据 数据排序 升序和降序 寻找数据的基本特征 数据透视 按需要汇总,数据审核,数据审核原始数据
2、(raw data),完整性审核 应调查的单位或个体是否有遗漏 所有的调查项目或变量是否填写齐全 准确性审核 数据是否真实反映实际情况,内容是否符合实际 数据是否有错误,计算是否正确等,数据审核二手数据 (second hand data),适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定数据是否符合自己分析研究的需要 时效性审核 尽可能使用最新的数据 确认是否有必要做进一步的加工整理,数据筛选与排序,数据筛选 (data filter),剔除不符合要求或有明显错误的数据 筛选出符合特定条件的数据,用Excel进行数据筛选,8名学生的考试成绩数据,数据筛选 (data filt
3、er),要求:筛选出各科成绩都高于70分的名单。,:自动筛选、高级筛选,数据排序 (data rank),作用 以发现一些明显的特征或趋势,找到解决问题的线索 有助于对数据进行检查纠错 为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 可借助于计算机完成,数据排序 (方法),分类数据的排序 字母型数据 有升序降序之分,但习惯上用升序 汉字型数据 可按汉字的首位拼音字母排序 也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:由小到大 递减排序:由大到小,数据透视表,数据透视表 (pivot table ),可以从复杂的数据中提取有用的信息 可以对数据表
4、的重要信息按使用者的习惯或分析要求进行汇总 形成一个符合需要的交叉表(列联表) 在利用数据透视表时,数据源表中的首行必须有列标题,数据透视表 (用Excel创建数据透视表),第1步:在Excel工作表中建立数据清单 第2步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】 第3步:确定数据源区域 第4步:在【向导3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第5步:在【向导布局】对话框中,依次将”分类变量“拖 至左边的“行”区域,上边的“列”区域,将需要汇 总的“变量” 拖至“数据区域” 第6步:然后单击【确定】,自动返回【向导3步骤之3】对 话框。
5、然后单击【完成】,即可输出数据透视表,注:2007版本 : 【插入】【数据透视表和数据透视图】,3.2 品质型数据的整理与展示,3.2.1 分类数据的整理与图示 3.2.2 顺序数据的整理与图示,3.2.1 品质型数据的分类与分布表 3.2.2 品质型数据的图示,数据的整理与展示 (基本问题),对品质型数据主要是 作分类整理 把整理的结果制成分布表 根据分布表绘制所需图形 对数值型数据主要是 作分组整理 把整理的结果制成分布表 根据分组数据和未分组数据绘制所需图形 适合于低层次数据的方法也适合于高层次的数据;但适合于高层次数据的方法并不适合于低层次的数据,品质型数据的分类与分布表,品质数据的分
6、类与分布表 (基本过程),列出各类别 制作频数分布表、累积频数分布表,频数(累积频数)分布(表),品质数据的分类与分布表 (例题分析),【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。右边就是记录的原始数据,用Excel制作频数分布表,品质数据的分类与分布表 (例题分析),方法一:直方图法 制作数据文件 两列:品牌名称与代码 设置接收区域 列出与接收区域代码对应的类别 工具(数据)数据分析直方图 修改分布表,方法二:数据透视法 制作数据文件
7、一列:品牌名称 数据分析(插入)数据透视表,用Excel制作频数分布表的2种方法,50名顾客购买饮料品牌的频数分布,品质数据的图示柱型图 (bar Chart),用宽度相同的条形的高度或长短来表示各类别数据的图形 有单式条形图、复式条形图等形式 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(column chart),品质数据的图示柱型图 (例题分析),品质数据的图示帕累托图(pareto chart),按各类别数据出现的频数多少排序 绘制柱形图,用Excel制作帕累托图:“直方图”、“频数分布表”,品质数据的图示饼图 (pie Chart),主要用于表示样本或总体中各组
8、成部分所占的比例 用于研究结构性问题,品质数据的图示环形图 (doughnut chart),与饼图类似,但又有区别 饼图只能显示一个样本或总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究,品质数据的图示环形图 (例题分析),【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?” 1非常不满意;2不满意;3一般;4满意;5非常满意。,品质数据的图示环形图 (doughnut chart) (例题分析),3.3 数值型数据的整理与展示,3.3.1
9、数值型数据的分组与分布表 3.3.2 数值型数据的图示,数值型数据的分组与分布表,分组与分布表 (分组),分组方法,分组与分布表 (单变量值分组),1.将一个变量值作为一组 2.适合于离散变量且变量值较少的情况,家庭户数按人口分布情况,分组与分布表 (组距分组:要点),将变量值的一个区间作为一组 适合于连续变量和变量值较多的离散变量 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组,分组与分布表 (组距分组:步骤),确定组数:应以能够显示数据的分布特征和规律为目的 组数一般为5K 15 可以通过数据排序观察应分组数 当数据很多且基本呈单峰对称分布时,可以按美国统计学家斯特吉斯(
10、Sturges) 提出的经验公式确定组数K 确定组距:组距(class width)是一个组的上限与下限之差 组距( 最大值 - 最小值) 组数 3. 确定组限:上限与下限,分组与分布表 (组距分组:几个概念),1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 组距(class width) :上限与下限之差 开口组:缺少一个组限的组 组中值(class midpoint) :下限与上限之间的中点值,分组与分布 表 (组距分组:例题分析),【例】某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组,分组与分布表 (
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 整理 图表 展示
链接地址:https://www.31doc.com/p-2602919.html