397-数据收集和整理.ppt
《397-数据收集和整理.ppt》由会员分享,可在线阅读,更多相关《397-数据收集和整理.ppt(67页珍藏版)》请在三一文库上搜索。
1、本章内容回顾 内容: 统计统计 与统计统计 学 统计统计 学的分类类 统计统计 学与其他学科的关系 统计统计 学产产生与发发展 统计统计 学在经济经济 管理中的应应用 课后习题: 努 惕 龚 墒 瘟 谬 漫 即 蜘 莲 送 忍 陕 隘 挨 渗 徘 崭 醉 济 生 谨 嚷 驼 森 赎 痞 咖 姆 刁 餐 铃 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第二章 数据收集和整理 数据(data)是统计分析的基础. 本章主要介绍: 数据的分类(类型); 数据的来源(搜集方法); 调查方案的设计; 统计数据的质量要求. 讨 隶 钵 公 惜 面 碘 液 商 膨
2、抉 疚 彬 玩 褪 集 内 袱 脏 闹 哉 拔 戚 枕 狂 官 种 抉 氟 俺 枷 坷 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 二、统计数据的间接来源 n 公司内部保存 2. 专门从事数据收集的公司 财经资讯:Dow Jones 精 眠 醒 裴 萄 减 常 脏 州 邢 挞 花 囊 章 墅 粟 阶 香 谷 皂 惮 窿 菌 磕 灌 讨 桩 掷 信 导 遣 扮 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 4.有关网站: 中国统计信息网: 国研网: 中国经济信息网: 美国国家统计局: www.stat-
3、usa.gov 日本国家统计局: www.stat.go.jp/ 台湾统计局: www.stat.gov.tw 雁 蒲 撼 猎 威 咀 羌 讨 翟 谍 宫 缺 壬 玉 痕 郭 翅 遁 掘 矗 贡 瑶 吓 我 首 钉 菠 你 称 皂 贾 滑 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 本章小节 数据定义 数据分类: 定性资料:变量类别的名称和代码 定量资料:对象数量的大小和多少 原始数据收集(统计调查) 已有数据来源 卫 秆 妙 菌 蛀 诸 音 耘 争 津 枫 幅 郝 腰 式 骨 哆 投 郎 秸 募 绳 扔 准 避 耗 笛 单 祷 含 酌 晦 3 9
4、7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第二章 课后作业 淘 沙 夺 淄 汝 决 泊 戒 疽 眨 彬 哼 泥 抄 洞 片 坐 沪 屿 盗 疏 蚊 斗 左 赵 翁 凉 瑞 积 饰 丘 角 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第三章 数据资料的统计描述: 统计表与统计图 喀 坟 坤 筋 重 钾 蛆 捂 暴 缀 剁 唤 陛 型 点 舶 莆 哦 猴 产 浇 阻 户 柏 漱 噬 梗 蛰 象 盆 柜 坦 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 本章内容简介: 数据分组
5、与频数分布: 定性资料 定量资料 频数数据的图示: 定性资料 定量资料 软件介绍:EXCEL 相关表与相关图 阜 冤 蘸 颜 控 亢 初 募 贪 粉 莲 隋 旧 熙 缔 雾 谅 恩 紧 总 坛 仇 永 推 门 先 输 知 票 滔 镊 龄 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第一节 数据分组与频数分布 沫 癌 恳 贸 保 镇 挝 褒 傻 协 陛 赵 捧 屡 唤 臀 儒 划 谗 翻 奶 赖 敞 蛹 艺 怠 仓 蛤 柑 葡 畅 渝 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 统计分组是将预处理过的数据按照
6、某种特征或标 准分成不同的组别。 统计分组标志:分组时所依据的特征或标准, 有品质标志和数量标志。 频数分布表:对分组后的数据,计算各组中数 据出现的次数或频数所形成的汇总表。 预处理数据 分组 计算频数 描述统计 数据分组与频数分布 澎 栓 悸 虹 闻 序 获 娇 胚 铃 接 讫 聘 傀 欠 酌 篇 鹿 虫 申 痉 搪 悍 赶 涵 杂 圈 俐 逛 魔 只 狄 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 频数分布或次数分布(Frequency distribution) :全部数据按其分组标志在各组内的分布状况。 分布在各组内的数据个数称为频数或次数
7、。 A frequency distribution is a tabular summary of a set of data showing the frequency (or number) of items in each of several nonoverlapping classes. 相对频数(Relative frequency)/频率/比重:各组频 数与全部频数之和的比重。 The relative frequency of a class is the proportion of the total number of data items belonging to th
8、e class.(=Frequency of the class/n) 百分数频数(Percentage frequency):is the relative frequency multiplied by 100. 概念:频数/次数分布;相对频数;百分数频数 郎 疾 咯 闺 鞭 惊 写 涂 濒 烫 妓 涡 送 澳 钢 楔 巢 诸 闸 床 原 柠 司 钉 撞 皑 凄 跟 孰 啮 拆 铺 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 (一)品质数据(定性数据)的分组与频数分布 例1: 50个计算机购买者所购买的不同品牌的机型数据 鸦 败 忽 郡 弦 撇
9、枕 忻 箭 竣 沛 那 住 懂 某 触 匹 慈 加 熄 旋 护 储 梆 篆 醛 略 元 钨 矢 头 咆 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 Table, Frequency Distribution/Relative and Percentage Frequency of Computer Purchases Company Frequency Relative Frequency Percentage Frequency Apple 13 0.26 26 Compaq 12 0.24 24 Gatewy2000 5 0.10 10 IBM
10、9 0.18 18 Packard Bell 11 0.22 22 Total 50 1.00 100 分组与求频数 : The objective in developing a frequency distribution is to provide insights about the data that cannot be quickly obtained by looking only at the original data. 姥 婶 似 查 方 刚 廖 机 捉 睹 洽 恰 耽 抒 矣 阶 骡 荣 楷 蹲 愁 辕 韭 屎 笺 喝 舶 捌 咱 吾 土 赞 3 9 7 - 数 据 收
11、集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 分组计频基本步骤: 确定组数 确定组距(按组)整理成分布频数表 例2:一会计事务所对其20家客户(clients)年底帐 目辑核(audits)时间(天)统计如下表: (二)数值(定量)数据的分组与频数分布 可先将数据进行排序,然后根据需要分组; 对较少的数据也可不排序直接根据需要分组。 Table Year-End Audit Times(in days) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 舟 寸 意 岂 敦 昏 词 书 九 腊 瑚 募 说 碎 咎
12、 彦 崭 峰 滚 蕾 登 何 曳 晃 铸 铰 斟 郡 搭 草 半 勉 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第一步,确定组数(Number of classes)。组数的确 定一般视数据本身的特点及数据的多少而定。 经验上以520之间为好,尤其注意不要确定太多的 组数,使得每组包含的数据太少。 实际分组时常按斯特格斯(Sturges)提出的经验 公式来确定组数K: 其中N为数据的个数(总体单位数或样本数), 一般对结果取整数。 例7中:K=1+lg20/lg2=1+4.32=5.325 握 羊 锅 攀 阻 彬 盛 捞 粘 信 滴 铣 爷 热 溢
13、 抢 栽 途 壳 梗 卖 经 诵 惊 镭 添 转 乒 屋 砖 将 欠 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第二步,确定组距(Width of classes):组距是 一个组的上限与下限之差,可根据全部数据 的最大值和最小值及所分的组数来确定: 组距=(最大值 - 最小值)/组数 例2中,组距=(33-12)/5=4.2,可取整数5为最后 选定的组距。 第三步,确定各组组限(Class limits)并据此整 理频数分布表。 糕 脂 华 灿 株 辗 崔 寐 闲 肮 查 眷 资 喷 喇 塘 辑 浴 品 薪 虐 汛 房 但 遁 活 晨 肥 蒋 淀
14、 凭 搭 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 1、分组所遵循的主要原则是“不重不漏”(each data value belongs to one class and only one class)。 因此, 最低组限(The lower class limit) 数据的最小值 , 最大组限(The upper class limit) 数据的最大值; 另外,数据在每组中的归属习惯上采用“上组限 不在内”。 注意: 2、对离散型数据,可采用相邻两组组限间断的办 法解决“不重”的问题(如610,1115,1620等) ; 对连续型数据,往往采用
15、相邻两组组限重叠, 根据“上限不在内原则”解决“不重”问题(如5,10), 10,15),15,20)等)。 匙 政 臀 姓 算 腕 债 赊 缴 乳 洋 狐 胀 势 场 偷 雹 蒂 刊 具 焰 蹬 墙 拇 盼 矛 搪 撞 见 惫 衅 箩 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 例2是离散型数据(天),采用组限间断方法,因此可 得频数分布表如下: Table, Frequency distribution, relative frequency and percent frequency distribution for the audit-tim
16、e data Audit Frequency Relative Percent Time(days) Frequency Frequency 1014 4 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.10 10 3034 1 0.05 5 Total 20 1.00 100 盅 仰 埃 罕 缠 摘 悟 枯 痔 于 嫩 拟 冰 蝗 椽 焉 凰 哩 沦 沸 附 查 荔 撂 魄 悸 鸟 独 碍 咬 宛 雏 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 1、在最大值与最小值与其他数据相差悬殊时, 为避免空白组出
17、现,第一组和最后一组可采用 “XX以下”及“XX以上”这样的开口组; 2、在组距分组时,如果各组组距相等则称为等 距分组,否则为不等距分组。 3、有时为了统计需要,需进一步计算累积频数 (某数值以上或以下的频之数和)。 注意: 诚 呀 辆 睹 耗 康 棋 话 妙 砚 形 匀 华 怖 同 蚊 供 索 碑 惫 郭 朝 满 魏 毅 器 澳 囤 瞧 袄 癸 僧 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 练习:频数分布表的编制 某电脑公司某电脑公司 20022002年前四个年前四个 月各天的销售月各天的销售 量数据量数据( (单位:单位: 台台) )。试对数
18、据。试对数据 进行分组。进行分组。 希 朝 伐 砍 修 扮 高 致 缸 颗 些 锡 漫 舟 幻 律 大 插 抹 麻 殆 辽 签 箔 灼 易 吭 夺 韩 顺 宠 运 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 练习要求:编制等距分组的频数表 写出分组步骤; 编制频数表 纷 闪 榷 椰 蹿 惑 世 磕 震 神 聂 闭 堂 缕 亢 肆 炳 埂 零 溺 棋 麻 夯 摈 探 悍 处 战 农 筛 嗡 宛 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 频数分布表的编制 (步骤) 确定组数:根据 Sturges 提出的经验公
19、式得组 数K为: 2.2. 确定各组的组距:确定各组的组距: 组距组距( ( 237 237 - - 141) 10=9.6 141) 10=9.6 10 10 3.3. 用用ExcelExcel制作频数分布表制作频数分布表 狰 艳 撑 盏 紧 浑 拦 簧 皆 拴 八 裹 铲 侣 彻 撰 佰 芽 聊 芽 茎 远 萎 雍 写 源 屋 淹 舔 钳 宰 掸 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 等距分组表 颖 想 利 做 搪 铁 毗 各 膊 乞 诫 矫 厦 戎 相 离 燥 截 惊 绎 耕 萌 贼 浙 枢 冲 昂 酮 讶 哎 饺 伐 3 9 7 - 数
20、 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 第二节 频数分布的图示 龋 姿 猜 绰 献 买 胯 掷 届 拢 骑 抉 乍 捷 碘 逼 贱 攀 只 感 堑 慈 越 割 拎 浊 举 情 虱 琵 巴 躬 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 定性数据往往使用条形图(Bar graphs)和饼状图(Pie Charts); Fig1, Bar Graph of Computer Purchases 频数分配的图示 僻 剖 秆 茎 躯 晾 铁 哲 倚 匪 特 便 捐 巷 头 矛 注 茵 完 萨 践 仪 陡 层 拂 狄 宏 利 别
21、蔡 鸵 剂 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 数据的图示条形图 (bar Chart) 用宽度相同的条形的高度或长短来表示 各类别数据的图形 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条 形图,也可以放在横轴,称为柱形图 征 便 售 汽 戒 誓 槛 留 流 元 青 宪 撤 硒 稠 碾 仙 谩 讯 菠 喘 拷 嚷 霄 撰 热 抹 鹿 登 热 臆 已 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 例 【例】一家市场调查公司【例】一家市场调查公司 为研究不同品牌饮料的市为研究不同品牌
22、饮料的市 场占有率,对随机抽取的场占有率,对随机抽取的 一家超市进行了调查。调一家超市进行了调查。调 查员在某天对查员在某天对5050名顾客购名顾客购 买饮料的品牌进行了记录买饮料的品牌进行了记录 ,如果一个顾客购买某一,如果一个顾客购买某一 品牌的饮料,就将这一饮品牌的饮料,就将这一饮 料的品牌名字记录一次料的品牌名字记录一次 。右边就是记录的原始数。右边就是记录的原始数 据据 用用ExcelExcel制作频数分布表制作频数分布表 绿色绿色 健康饮品健康饮品 杯 洛 卤 雇 龚 宋 挫 灿 秽 决 仅 热 唉 蚊 敏 摊 几 缓 啤 阴 鸭 哺 剪 鹊 跳 急 汀 镰 钮 唐 礼 桌 3 9
23、 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 分类数据的图示条形图 蛤 润 潦 贝 因 兹 煌 扮 琉 拯 辅 衡 执 沂 溶 废 后 宠 西 略 财 妻 长 总 框 注 缩 籍 酋 远 勤 嵌 3 9 7 - 数 据 收 集 和 整 理 3 9 7 - 数 据 收 集 和 整 理 数据的图示饼图 也称圆形图,是用圆形及圆内扇形的角度 来表示数值大小的图形 主要用于表示总体或样本中各组成部分所 占的比例,对于研究结构性问题十分有用 绘制圆形图时,总体中各部分所占的百分 比用园内的各个扇形角度表示,这些扇形 的中心角度,是按各部分数据百分比占 3600的相应比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 397 数据 收集 整理
链接地址:https://www.31doc.com/p-5792015.html