第2章用图表展示数据22年课件.ppt

资源ID：2548991 资源大小：784.01KB 全文页数：71页
资源格式： PPT 下载积分：8元

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要8元

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

第2章用图表展示数据22年课件.ppt

第 2 章用图表展示数据,2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表,Display,2019-4-6,用哪些图形展示奖牌？,2009年7月26日至8月3日第13届世界游泳锦标赛在意大利罗马举行。美国的泳坛霸主地位难以撼动，中国军团也创造了史上第二的佳绩在本届游泳世锦赛上，中国代表团取得金牌数和奖牌与美国并列第一、奖牌榜排名第二的好成绩，而且中国男子游泳首次夺得世界性大赛的冠军并一举打破世界纪录。本届游泳世锦赛共设有奖牌227枚，其中金牌75枚、银牌75枚、铜牌77枚。下表是本届游泳世锦赛金牌总数取得前三名的国家所获得奖牌的分布情况,2019-4-6,用哪些图形展示奖牌？,根据上面的数据，你认为可以选择哪些图形来展示三个国家所获得的奖牌情况？学完本章的图表展示技术，这样的问题就会迎刃而解,2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示,第 2 章用图表展示数据,2.1.1 生成频数分布表,2.1 用图表展示定性数据,2019-4-6,生成频数分布表 (定性数据),1. 列出各类别,3. 生成频数分布表,2019-4-6,定性数据的描述统计量,频数(frequency) ：落在各类别中的数据个数比例(proportion) ：某一类别数据个数占全部数据个数的比值百分比(percentage) ：将对比的基数作为100而计算的比值比率(ratio) ：不同类别数值个数的比值,2019-4-6,生成频数分布表 (定性数据),【例2-1】为研究人们对不同类型软饮料的偏好情况，一家调查公司在某超市随机调查了50名顾客。右表是顾客性别及其所偏好的饮料类型记录。生成频数分布表，观察不同性别的顾客及其所偏好的饮料类型的分布状况，并进行描述性分析,制作频数分布表,Excel,2019-4-6,使用Excel数据透视表计数 (pivot table),第1步：选择【数据】菜单中的【数据透视表和数据透视图】第2步：确定数据源区域(在操作前将光标放在任意数据单元格内，系统会自动选定数据源区域) 第3步：在【向导3步骤之3】中选择数据透视表的输出位置，然后选择【布局】第4步：在【向导布局】对话框中，依次将“饮料类型”拖至左边的“行”(或列)区域，将“顾客性别”拖至 “列”(或行)区域，将“饮料类型”拖至“数据”区域。第5步：单击【确定】，自动返回【向导3步骤之3】对话框。单击【完成】,用数据透视表生成定性数据的频数分布,Excel,2019-4-6,生成频数分布表 (列联表Excel),不同类型饮料和不同性别顾客的频数分布,绿色健康饮品,2019-4-6,用SPSS生成定性数据的频数分布表 (单变量频数分布表),第1步：选择【Analyze】【Descriptive Statistics-Frequencies】进入主对话框第2步：将“饮料类型”或“顾客性别”选入【Variable(s)】；选中【Display Frequency tables】第3步 (若需要描述统计量或图形)主点【Statistics】或【Charts】，并选择相应的选项。点击【OK】,生成频数分布表,SPSS,2019-4-6,生成频数分布表 (定性数据SPSS),不同类型饮料的频数分布,升序排列 (汉字拼音字母),2019-4-6,用SPSS生成定性数据的列联表 (Crosstabulation交叉表),第1步：选择【Analyze】【Descriptive Statistics- Crosstabs】进入主对话框第2步：将“饮料类型”选入【Row(s)】，将“顾客性别”选入【Column(s)】(行列可以互换) 第3步： (若需要对列联表进行描述性分析)点击【Cells】，在【Percentages】下选中需要的统计量，如【Row】、【Column】、【Total】等；(若需要图形)点击【Display clustered bar chart】。点击【OK】,生成交叉频数分布表,SPSS,2019-4-6,列联表的描述性分析 (例题分析SPSS),列联表的统计描述,行百分比,列百分比,2019-4-6,列联表的描述性分析 (例题分析SPSS),列联表的统计描述,行百分比,列百分比,2.1.2 定性数据的图示,2.1 用图表展示定性数据,2019-4-6,条形图 (bar Chart),用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴，称为条形图，可以放在横轴，称为柱形图(column chart),2019-4-6,复式条形图 (bar Chart),饮料类型和顾客性别的条形图 (SPSS的输出),2019-4-6,帕累托图 (pareto chart),按各类别数据出现的频数多少排序后绘制的柱形图用于展示分类数据的分布,2019-4-6,用SPSS绘制饼图 (Pie),第1步：选择【Graphs】【Interactive-Pie-Clustered】，进入主对话框第2步：如果绘制简单饼图，将某个分类变量(如“饮料类型”)选入【Slice】(部分，片)；点击【Pies】，选择在饼图中要展示的内容，如【Category】、【Count】、【Percen】等。点击【确定】如果要绘制复式饼图，将某个分类变量(如“饮料类型”)选入【Slice】；将另一个分类变量(如“顾客性别”)选入【Cluster】；点击【Pies】，选择在饼图中要展示的内容，如【Category】、【Count】、【Percen】等。点击【确定】,绘制饼图,SPSS,2019-4-6,简单饼图 (pie Chart),用圆形及圆内扇形的角度来表示数值大小的图形，主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题,2019-4-6,复式饼图 (pie Chart),主要用于展示两个或多个分类变量的构成比较，比如，在男女分类的基础上又增加了饮料类型的分类。,2019-4-6,环形图 (doughnut chart),环形图中间有一个“空洞”，样本或总体中的每一部分数据用环中的一段表示与饼图类似，但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列，每一个样本或总体的数据系列为一个环用于结构比较研究,2019-4-6,环形图 (doughnut chart),【例2-2】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成,2019-4-6,环形图 (doughnut chart ),北京、上海和天津地区按收入法计算的地区生产总值,2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示,第 2 章用图表展示数据,2.2.1 生成频数分布表,2.2 用图表展示定量数据,2019-4-6,生成频数分布表 (例题分析),【例2-3】某电脑公司120天的销售额数据(单位：万元) 。生成一张频数分布表观察销售额分布的特征,2019-4-6,生成频数分布表 (例题分析),确定组数：组数的确定应以能够显示数据的分布特征为目的。在实际分组时，组数一般为5K 15。本例中由于数据较多，可考虑分为10组确定组距：组距(Class Width)是一个组的上限与下限之差，可根据全部数据的最大值和最小值及所分的组数来确定，即组距( 最大值 - 最小值)÷ 组数例如，本例最大值为237，最小值为141，组距=(237-141)÷109.6。为便于计算，组距宜取5或10的倍数，且第一组的下限应低于最小变量值，最后一组的上限应高于最大变量值，因此组距可取10 统计出各组的频数。每个组的数据满足axb(上限值不在内(Excel的计数规则是axb),2019-4-6,分组中的几个概念,1. 下限(lower limit) ：一个组的最小值 2. 上限(upper limit) ：一个组的最大值 3. 组距(class width) ：上限与下限之差 4. 组中值(class midpoint) ：下限与上限之间的中点值,制作频数分布,Excel,2019-4-6,生成频数分布表 (例题分析),某电脑公司销售额的频数分布,2019-4-6,使用Excel频数函数 (FREQUENCY),Excel的【直方图】工具的缺陷是：频数分布及直方图没有与数据链接，当改变任何一个数据时，频数分布表和直方图不会跟着改变使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是选择与接受区域相临近的单元格区域，作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域，在【Bins-array】后输入接受区域同时按下“ctrl-shift-Enter”组合键，即得到频数分布,统计函数FREQUENCY,Excel,2.2.2 定量数据的图示,2.2 用图表展示定量数据,2019-4-6,分组数据看分布直方图 (histogram),用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中，用横轴表示数据分组，纵轴表示频数或频率，各组与相应的频数就形成了一个矩形，即直方图直方图下的总面积等于1,2019-4-6,用SPSS绘制直方图,第1步：选择【Graphs】菜单，并选择【histogram】选项进入主对话框第2步：在主对话框中将变量选入【Variables】，点击【OK】,绘制直方图,SPSS,2019-4-6,分组数据看分布直方图 (SPSS绘制的直方图),2019-4-6,分组数据看分布直方图 (直方图与条形图的区别),条形图中的每一矩形表示一个类别，其宽度没有意义，而直方图的宽度则表示各组的组距由于分组数据具有连续性，直方图的各矩形通常是连续排列，而条形图则是分开排列条形图主要用于展示定性数据，而直方图则主要用于展示定量数据,2019-4-6,未分组数据看分布茎叶图 (stem-and-leaf plot),用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成，其图形是由数字组成的以该组数据的高位数值作树茎，低位数字作树叶树叶上只保留最后一位数字茎叶图类似于横置的直方图，但又有区别直方图可观察一组数据的分布状况，但没有给出具体的数值茎叶图既能给出数据的分布状况，又能给出每一个原始数值，保留了原始数据的信息直方图适用于大批量数据，茎叶图适用于小批量数据,2019-4-6,用SPSS绘制茎叶图和箱线图 (包括直方图),第1步：选择【Analyze】菜单，并选择【Descriptive statistics-Explore】选项进入主对话框第2步：在主对话框中将变量选入【Variables】，点击【Plots】，在对话框中选择【Stem- and-leaf】(根据需要可选【Histogram】以给出直方图)。点击【Continue】回到主对话框。点击【OK】,绘制茎叶图,SPSS,2019-4-6,未分组数据看分布茎叶图 (例题分析),某电脑公司销售额分布的茎叶图,2019-4-6,未分组数据看分布茎叶图 (例题分析),第一列给出每个茎上叶子的频数第二列是“茎”，第三列是“叶” 下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例) SPSS自动将每个茎重复了一次，使分布的细节看的更清楚一些。当然，在数据较少时茎的数值也可以不重复,2019-4-6,未分组数据看分布箱线图 (box plot),用于显示未分组的原始数据的分布箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值绘制方法首先找出一组数据的5个特征值，即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子，再将两个极值点与箱子相连接,2019-4-6,未分组数据看分布箱线图 (箱线图的构成),中位数,4,6,8,10,12,Median/Quart./Range箱线图,2019-4-6,未分组数据看分布箱线图 (例题分析),最小值 141,最大值 237,中位数 182,25%四分位数 170.25,75%四分位数 197,140 150 160 170 180 190 200 210 220 230 240,某电脑公司销售额数据的Median/Quart./Rang箱线图,2019-4-6,分布的形状与箱线图,不同分布的箱线图,对称分布,Bell-shaped distribution,Left-skewed distribution,左偏分布,右偏分布,Right-skewed distribution,2019-4-6,未分组数据看分布多批数据箱线图 (例题分析),【例2-4】从某大学经济管理专业二年级学生中随机抽取11人，对8门主要课程的考试成绩进行调查，所得结果如表。试绘制各科考试成绩的批比较箱线图，并分析各科考试成绩的分布特征,2019-4-6,用SPSS绘制多批数据箱线图,第1步：选择【Graphs】下拉菜单，并选择【Boxplot】第2步：在出现的对话框中选择【Simple】，在【Data in Chat Are】中选择【Summaries of separate variables】，点击【Define】返回主对话框第3步：在主对话框将所有变量(这里是11个学生)选入【Boxes Represent】，将“课程名称”选入【Label Cases by】。点击【OK】,绘制箱线图,SPSS,2019-4-6,未分组数据多批数据箱线图 (例题分析Median/Quart./Range),8门课程考试成绩的箱线图,2019-4-6,11名学生考试成绩的Median/Quart./Range箱线图,未分组数据多批数据箱线图 (SPSS绘制的箱线图),2019-4-6,垂线图可用于展示多个变量或多个样本取值的分布状况将属于同一样本或类别的多个取值的散点用一条垂线连接起来，用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其变动状况,未分组数据垂线图 (drop-line),用SPSS制作垂线图第1步：选择【Graphs】菜单，并选择【Line】第2步：在出现的对话框中选择【Drop-line】，在【Data in Chart Are】中选择【Values of individual cases】，点击【Define】返回主对话框第3步：在主对话框中将所有变量选入【Points Represent】。在【Category Labels】下选择【Variable】，并将相应的类别选入框内。点击【OK】,绘制垂线图,SPSS,2019-4-6,未分组数据垂线图 (例题分析),11名学生8门课程考试成绩的垂线图,2019-4-6,误差图是以均值为中心，加减一定倍数的标准差(也可以是加减一定倍数的标准误差)绘制而成的(该图也可以绘制均值的一定置信水平的置信区间) 用于展示多个样本或分类的不同取值的分布状况和离散状况,未分组数据误差图 (error bar ),用SPSS制作垂线图第1步：选择【Graphs】菜单，并选择【Error Bar】。第2步：在出现的对话框中选择【Simple】，在【Data in Chart Are】中选择【Summaries of separate variables】，点击【Define】返回主对话框。第3步：在主对话框中将所有变量选入【Error Bars】。在【Bars Represent】下选择【Standard deviations】，在【Multiplier】框内输入所需的标准差倍数。点击【OK】。,绘制误差图,SPSS,2019-4-6,未分组数据误差图 (例题分析),11名学生8门课程考试成绩的误差图(均值加减2倍的标准差),2019-4-6,两个变量间的关系二维散点图 (2D Scatter plots),展示两个变量之间的关系用横轴代表变量x，纵轴代表变量y，每组数据(xi ， yi)在坐标系中用一个点表示，n组数据在坐标系中形成的n个点称为散点，由坐标及其散点形成的图有2维、3维、矩阵等形式,2019-4-6,两个变量间的关系二维散点图 (2D Scatter plots),【例2-5】表212是我国31 个地区2006年的固定资产投资额、地区生产总值(GDP)和最终消费支出数据。绘散点图并观察它们之间的关系,2019-4-6,用SPSS绘制重叠散点图 (Overlay Scatter),第1步：选择【Graphs】菜单，并选择【Scatter/Dot】第2步：如果绘制两个变量的简单散点图，点击【Simple Scatter】，点击【Define】，将两个变量分别选入【Y Pairs】和【X Pairs】，点击【OK】如果要绘制重叠散点图，点击【Overlay Scatter】，点击【Define】，将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”)，点击【OK】如果要绘制矩阵散点图，点击【Matrix Scatter】，将几个变量(本例为“固定资产投资额”、“地区生产总值”和“固定资产投资额”)同时选入【Matrix Variables】，将区分坐标轴的样本(本例为“地区”)选入【Label Cases by】，点击【OK】,绘制重叠散点图,SPSS,2019-4-6,两个变量间的关系二维散点图 (2D Scatter plots),2019-4-6,如果想比较几个变量之间的关系，也可以把它们的散点图绘制在同一张图里，绘制成重叠散点图(Overlay Scatter)(注意：绘制重叠散点图时，变量值之间的数值差异不能过大，否则不便于比较) 比如，如果想比较固定资产投资额与地区生产总值和最终消费支出的关系，可以把固定资产投资作为共同的一个坐标轴，地区生产总值和最终消费支出作为另一个坐标轴也可以绘制散点图矩阵(Matrix Scatter),两个变量间的关系重叠散点图 (用SPSS绘制重叠散点图),2019-4-6,两个变量间的关系重叠散点图 (Overlay Scatter),2019-4-6,两个变量间的关系矩阵散点图 (Matrix Scatter),2019-4-6,比较多个样本的相似性雷达图 (radar chart),也称为蜘蛛图(spider chart) 从一个点出发，用每一条射线代表一个变量，多个变量的数据点连接成线，即围成一个区域，多个样本围成多个区域，就是雷达图可用于研究多个样本在多个变量上的相似程度当多个变量的取值相差较大或量纲不同时，可进行变换处理后再做图。线性变换：对数变换：,2019-4-6,多变量数据雷达图 (例题分析),【例2-6】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表28所示。绘制雷达图，比较不同地区的消费支出构成,2019-4-6,多变量数据雷达图 (例题分析原始数据),四个地区城镇居民消费支出中，食品支出额都是最多的，杂项商品与服务支出额则是最少的东部地区城镇居民的各项支出额普遍高于其他三个地区，而中部、西部和东北地区的各项支出则相差不大四个地区各项支出额的结构具有很大的相似性,2019-4-6,多变量数据雷达图 (例题分析标准化变换),更适宜分析多个样本在多个变量上的差异东部地区城镇居民的各项支出额普遍高于其他三个地区，而中部、西部和东北地区的各项支出则相差不大四个地区各项支出额的结构具有很大的相似性,2019-4-6,20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法将各变量用一系列平行的横坐标轴表示，变量值对应纵轴上的位置可用于研究多个样本在多个变量上的相似程度或变量间的相互关系,比较多个样本的相似性平行坐标图 (轮廓图),2019-4-6,多变量数据轮廓线图 (例题分析比较样本：地区),四个地区城镇居民消费支出中，食品支出额都是最多的，杂项商品与服务支出额则是最少的东部地区城镇居民的各项支出额普遍高于其他三个地区，而中部、西部和东北地区的各项支出则相差不大四个地区各项支出额的结构具有很大的相似性,2019-4-6,多变量数据轮廓线图 (例题分析比较变量：各项支出),四个地区城镇居民消费支出中，食品支出额都是最多的，杂项商品与服务支出额则是最少的东部地区城镇居民的各项支出额普遍高于其他三个地区，而中部、西部和东北地区的各项支出则相差不大四个地区各项支出额的结构具有很大的相似性,2.3 合理使用图表,第 2 章用图表展示数据,2019-4-6,一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上，而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明 5种鉴别图表优劣的准则：一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况,鉴别图表优劣的准则,2019-4-6,本章小结,定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用Excel和SPSS作频数分布表和图形合理使用图表,结束,THANKS,

注意事项

本文（第2章用图表展示数据22年课件.ppt）为本站会员（本田雅阁）主动上传，三一文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。