第二章数据集的描述方法.ppt
《第二章数据集的描述方法.ppt》由会员分享,可在线阅读,更多相关《第二章数据集的描述方法.ppt(107页珍藏版)》请在三一文库上搜索。
1、第二章 数据集的描述方法,学习目标,用于描述品质标志的图形 用于描述数量标志的图形 解释数值数据的属性 描述综合测量 适用综合测量分析数值数据,思 考,Us的市场份额时候远超过其他所有的竞争对手?,30%,32%,34%,36%,Us,Y,X,数据显示,定性数据的表示,数据显示,汇总表,列出各个分类及各类相关元素的数据 获得各类相应计数 可以显示为频数(计数)或者频率(),也可是两者,Row Is Category,Tally: | | | |,数据显示,条形图,Vertical Bars for Qualitative Variables,Bar Height Shows Frequency
2、 or %,Zero Point,Percent Used Also,Equal Bar Widths,Frequency,数据显示,Econ.,10%,Mgmt.,25%,Acct.,65%,饼图,显示了将重量分解成各个类别 对显示相对差异比较有用 每一类百分比等于该类角度数与360的百分比(percent),Majors,(360) (10%) = 36,36,数据显示,柏拉图,类似与条形图,只是柏拉图是按从左到右根据条形图的高度按照递减的方式重新排序各分类,Vertical Bars for Qualitative Variables,Bar Height Shows Frequency
3、 or %,Zero Point,Percent Used Also,Equal Bar Widths,Frequency,思 考,如果你是某研究所的分析师,你想显示2006年各网络游览器所占份额,试着用条形图、饼图和柏拉图描述以下数据,条形图解决方案*,Market Share (%),Browser,饼图的解决方案*,Market Share,柏拉图解决方案*,Market Share (%),Browser,定量数据表示方法,数据显示,茎叶图,1. 将每个观察数据都划分成茎值和叶值 茎值定义了类别 叶值定义了每一类的频数(计数),2. Data: 21, 24, 24, 26, 27,
4、27, 30, 32, 38, 41,26,2,144677,3,028,4,1,数据显示,制作频数分布表的步骤,定义范围 选择组数 通畅在5-15组之间 组距计算 (宽度) 定义组界(限制) 计算组中值 计算分配到各类的观测值计数,例:频数分布表,原始数据: 24, 26, 24, 21, 27 27 30, 41, 32, 38,组距,(下限 + 上限) / 2,组距,类别,组中值,频率,15.5 25.5,20.5,3,25.5 35.5,30.5,5,35.5 45.5,40.5,2,相对频率( %)分布表,百分比分布,相对频率分布,Class,Prop.,15.5 25.5,.3,2
5、5.5 35.5,.5,35.5 45.5,.2,Class,%,15.5 25.5,30.0,25.5 35.5,50.0,35.5 45.5,20.0,数据显示,0,1,2,3,4,5,直方图,Frequency Relative Frequency Percent,0 15.5 25.5 35.5 45.5 55.5,Lower Boundary,Bars Touch,Class,Freq.,15.5 25.5,3,25.5 35.5,5,35.5 45.5,2,Count,数字资料的特性,思 考,. 引证雇员低工资一例 - 大多数的雇员收入仅为$20,000. . 董事长声称平均收入是
6、 $70,000!,$400,000,$70,000,$50,000,$30,000,$20,000,标准符号表示,测量,样本,总体,均值,标准差,S,方差,数目,n,N,数据的数字属性,中心趋势(位置),方差 (离差),形状,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,中心趋势,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,均值,测量中心趋势 最常用的衡量标准 充当平衡点 容易受到极端值的影响(异常值) 公式 (
7、样本均值),求均值,原始数据: 10.3 4.9 8.9 11.7 6.3 7.7,X,X,n,X,X,X,X,X,X,i,i,n,1,1,2,3,4,5,6,6,10,3,4,9,8,9,11,7,6,3,7,7,6,8,30,.,.,.,.,.,.,.,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,中位数,测量中心趋势 将变量排序后处于中间位置的变量值 如果n为奇数,则为排序序列位于中间的变量值 If 如果n为偶数,则为中间位置两个变量值的平均 变量序列中间位置 不受极端值的影响,中位数案例 n为奇数
8、的例子,Raw Data: 24.1 22.6 21.5 23.7 22.6 Ordered: 21.5 22.6 22.6 23.7 24.1 Position: 1 2 3 4 5,Positioning,Point,Median,n,1,2,5,1,2,3,0,22,6,.,.,中位数案例 n为偶数的例子,Raw Data: 10.3 4.9 8.9 11.7 6.3 7.7 Ordered: 4.9 6.3 7.7 8.9 10.3 11.7 Position: 1 2 3 4 5 6,Positioning,Point,Median,n,1,2,6,1,2,3,5,7,7,8,9,2
9、,8,30,.,.,.,.,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,众数,测量集中趋势 出现最多的值 不受极端值影响 可以没有众数或有几个众数 可以用于定量数据也可用于定性数据,众数的例子,没有众数 Raw Data: 10.3 4.9 8.9 11.7 6.3 7.7 一个众数 Raw Data: 6.3 4.9 8.9 6.3 4.9 4.9 多于一个的众数 Raw Data: 21 28 28 41 43 43,思 考,假设你是银河证券公司是金融分析师,你收集了某新发行股票的收盘价如下: 17
10、, 16, 21, 18, 13, 16, 12, 11. 描述这只新股价格的中心趋势,中心趋势的解决方案*,均值,X,X,n,X,X,X,i,i,n,1,1,2,8,8,17,16,21,18,13,16,12,11,8,15,5,.,中心趋势的解决方案*,中位数 Raw Data: 17 16 21 18 13 16 12 11 Ordered: 11 12 13 16 16 17 18 21 Position: 1 2 3 4 5 6 7 8,Positioning Point,Median,n,1,2,8,1,2,4,5,16,16,2,16,.,中心趋势的解决方案*,众数 Raw D
11、ata: 17 16 21 18 13 16 12 11 Mode = 16,中心趋势测量总结,Measure,Formula,Description,均值,X,i,/,n,均衡点,中位数,(,n,+1),位置,2,排序后中间位置,的变量值,众数,无,出现频率最高的值,形 状,形状,描述数据如何分布 形状的测量 偏度 = 对称,右偏,左偏,对称,Mean,=,Median,Mean,Median,Median,Mean,方 差,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,全距,测量离差 等于变量的最大值
12、与最小值之差 Range = Xlargest Xsmallest 忽略了数据的分布,7,8,9,10,7,8,9,10,Range = 10 7 = 3,Range = 10 7 = 3,数字数据的属性和测量,数值数据属性,均值,中位数,众数,中心趋势,全距,方差,标准差,方差,百分位,相对位置,四分位差,Zscores,方差和标准差,测量离差 最常用的测量方面 考虑了数据的分布,4,6,10,12,X,= 8.3,8,样本方差的公式,n - 1 作为分母! (如果是总体方差则使用N),=,样本标准差的公式,S,S,X,X,n,X,X,X,X,X,X,n,i,i,n,n,2,2,1,1,2,
13、2,2,2,1,1,(,),(,),(,),(,),方差的例子,Raw Data: 10.3 4.9 8.9 11.7 6.3 7.7,S,X,X,n,X,X,n,S,i,i,n,i,i,n,2,2,1,1,2,2,2,2,1,8,3,10,3,8,3,4,9,8,3,7,7,8,3,6,1,6,368,(,),(,),(,),(,),where,.,.,.,.,.,.,.,.,思考,假设你是银河证券公司是金融分析师,你收集了某新发行股票的收盘价如下: 17, 16, 21, 18, 13, 16, 12, 11. 这只股票价格的方差和标准查是多少?,方差的解决方案*,Sample Varia
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 数据 描述 方法
链接地址:https://www.31doc.com/p-3151257.html