统计课后作业题(哈尔滨工业大学MBA课程)..pdf
《统计课后作业题(哈尔滨工业大学MBA课程)..pdf》由会员分享,可在线阅读,更多相关《统计课后作业题(哈尔滨工业大学MBA课程)..pdf(15页珍藏版)》请在三一文库上搜索。
1、1 第一章 3、某大学拟从该校20 000 名在校生中抽选1 000 人进行调查, 以了解大学生课外生活情况。 调查项目主要包括:学生所在年级、课外时间的分配、课外活动的形式及占用时间、最喜欢 的课外活动等。请写出这次调查的总体、样本及个体都是什么? 调查总体为该校20000 名在校生; 调查样本为所抽选的1000 名学生; 调查的个体为该校的每一个学生。 4、根据题3 写出调查项目中的数据属于那一种测度水平 调查项目测度水平 学生所在年级定序水平的变量 课外时间的分配定距水平的变量 课外活动形式定类水平的变量 课外活动占用时间定距水平的变量 最喜欢的课外活动定类水平的变量 第二章 9、某集团
2、公司下属40 个企业, 2002 年的产品销售收入数据(单位:万元)如下: 152 105 117 124 119 108 97 88 129 114 105 116 115 110 123 115 100 87 107 103 103 137 119 138 92 118 120 95 142 136 127 135 117 104 125 112 146 113 108 126 要求: (1) 根据上面的数据进行适当的分组,编制频数分布表, 计算出累积频数和累积频率; (2)按规定,销售收入在125 万元以上为先进企业,115 万元 125 万元为良好企业, 105115 万元为一般企业,
3、105 万元以下为落后企业,按先进企业、良好企业、一般企业、 落后企业进行分组。 频数分布表 按销售额分组 企业数 (频数) 向下累计 频数 向上累计 频数 企业数 (频率) 向下累计 频率 向上累计 频率 100万元以下5 40 5 0.125 1.000 0.125 100110 万元9 35 14 0.225 0.875 0.350 110120 万元12 26 26 0.300 0.650 0.650 120130 万元7 14 33 0.175 0.350 0.825 130140 万元4 7 37 0.100 0.175 0.925 140万元以上3 3 40 0.075 0.07
4、5 1.000 合计40 1.000 按企业优良分组 企业优良按销售额分组 企业数 (频数) 向下累 计频数 向上累 计频数 企业数 (频率) 向下累 计频率 向上累 计频率 先进企业125 万元以上11 40 11 0.275 1.000 0.275 良好企业115125 万元11 29 22 0.275 0.725 0.550 一般企业105115 万元9 18 31 0.225 0.450 0.775 落后企业105 万元以下9 9 40 0.225 0.225 1.000 合计40 1.000 2 第三章 7、甲、乙两个企业生产三种产品的单位成本和总成资料如下: 产品名称单位成本 总成
5、本 甲企业乙企业 A 15 2100 3255 B 20 3000 1500 C 30 1500 1500 试比较哪个企业的总平均成本高并分析其原因。 解:根据甲、乙两企业的单位成本和总成本可得各产品生产数量: 产品名称单位成本 总成本产品数量 甲企业乙企业甲企业乙企业 A 15 2100 3255 140 217 B 20 3000 1500 150 75 C 30 1500 1500 50 50 由此,可得总平均成本: 产品名称 甲企业乙企业 产品数量总成本平均成本产品数量总成本平均成本 A 140 2100 15 217 3255 15 B 150 3000 20 75 1500 20
6、C 50 1500 30 50 1500 30 合计340 6600 19.41 342 6255 18.29 由此,看出甲企业的总平均成本高于乙企业的总平均成本,原因在于:尽管甲、乙企业的各 产品的单位成本一样,但是,由于乙企业生产A 产品的数量较多,因此,在计算总平均成 本时,产生的影响较大,使得乙企业的总平均成本低于甲企业的总平均成本,这说明,在用 组平均数进行平均时,其结构(该题中的生产数量)对总平均产生了影响。 8根据下表数据评价说明甲乙两村平均产量的高低,并说明理由。 按耕作 条件分组 甲村乙村 播种 面积 比重 (%) 总产量平均产量 播种 面积 比重 (%) 总产量平均产量 水
7、田 旱田 650 350 65 35 260 000 70 000 400 200 675 825 45 55 276 750 185 625 410 225 合计1 000 100 330 000 330 1 500 100 462 375 308 如果笼统的比较甲乙两村的总平均产量,则甲村的总平均产量(330)高于乙村的总平均 产量( 308) ,但是,如果按水田、旱田平均产量分别比较,乙村的平均产量(410,225)高 于甲村的平均产量(400, 200) 。出现这种现象的原因在于,由于对于耕作土地进行了分组 (水田、旱田) ,因此,在进行平均时,其结构(水旱田的比重)对总平均产生了影响
8、,在 这里由于乙村旱田比较较大,因此,乙村的总平均产量低于甲村。 3 9、某百货公司6 月份日销售额数据(单位:万元)如下: 257 271 272 276 292 284 297 261 268 252 281 303 238 301 273 310 274 263 240 267 322 236 280 249 265 291 269 278 258 295 要求:(1)计算该百货公司日销售额的均值、中位数和众数; (2)计算日销售额的标准差; 解: (1)1.均值 =日销售额 /n=8223/30=274.10 万元 2.由于数据n=30,经过排序可知X15=272,X16=273 所以
9、得中位数Me=(X15+X16)/2=(272+273)/2=272.50万元 3.通过观察该组数据发现,所有数据均出现一次,所以该组数据无众数 ( 2) X X-(X- ) 2 236 -38 1452 238 -36 1303 240 -34 1163 249 -25 630 252 -22 488 257 -17 292 258 -16 259 261 -13 172 263 -11 123 265 -9 83 267 -7 50 268 -6 37 269 -5 26 271 -3 10 272 -2 4 273 -1 1 274 0 0 276 2 4 278 4 15 280 6
10、35 281 7 48 284 10 98 291 17 286 292 18 320 295 21 437 297 23 524 301 27 724 303 29 835 310 36 1289 322 48 2294 4 X=8223 )(XX 0.00 2 )(XX 13002.70 由此可得:样本方差 2 S 2 )(XX/(n-1)= 13002.7/ (30-1)=488.369 样本标准差S=)1/()( 2 nXX=369.488=21.174 10. 对 10 名成年人和10 名幼儿的身高(单位:cm)进行抽样调查,结果如下: 成年组166 169 172 177 180
11、170 172 174 168 173 幼儿组68 69 68 70 71 73 72 73 74 75 要求:(1)要比较成年组和幼儿组的身高差异,应采用什么样的指标? (2)比较分析哪一组的身高差异大。 解: (1)可以采用全距R,平均差 MAD ,方差 S2,标准差 S,离散系数VS来描述成年组和 幼儿组的身高差异。 描述指标成年组幼儿组 X 172.1 71.3 全距 R Xmax-Xmin 14 7 平均差 MAD n XX 3.12 2.1 方差 S2 1 2 n XX 17.65 6.23 标准差 S 1 2 n XX 4.2 2.49 离散系数VS X S 0.024 0.03
12、5 (2)从以上结果来看,全距R,平均差MAD ,方差 S2,标准差S 所体现的都是成年组的 身高差异较大,但是比较均值不相同两组数据的相对离散程度时,采用离散系数更为准确 一些,因此, 从本例中可以看出,儿童组的离散系数较大,也就是说儿童组的身高差异较大。 第五章 3、设已知某果园某种果树每株产量服从正态分布。随机抽取6 株计算其年产量(单位:kg) 为 222.2,190.4,201.9,204,256.1,236 试以 95%的置信度,估计全部果树的平均年产量 的置信区间。 解:由于n=630 所以该样本服从n-1 的 t 分布 X=(222.2+190.4+201.9+204+256.
13、1+236 ) /6=218.43 S= 1 2 n XX=24.53 又已知 1-=0.95,=0.05查表可得t /2(n-1)= t0.05/2(5-1)=2.571 则 的置信区间为( n S ntX)1( 2/ ) , 即( 218.43 2.571 24.53/5) ,亦即( 218.43 28.21) 从而( 190.22,246.64) 5 所以全部果树在置信度95%的条件下,平均年产量的置信区间为190.22kg 至 246.64kg。 6、某地区共有奶牛2500 头,随机调查了几处共400 头,得出每头奶牛的平均年产奶量为 3000kg,均方差为300,试以 95%的置信度
14、估计该地区牛奶全年总产量的置信区间。 解:X=3000kg,S=300,n=400 1-=0.95 ,=0.05 因为 n/N=400/2500=0.16 0.05, 故需考虑用有限修正因子修正, 查表可得 z /2= z0.05/2=1.96,则 的置信区间为 ( 1 2/ N nN n zX ) 即( 3000 1.96 400 300 12500 4002500 )=(3000 1.96 15 0.9165) (3000 26.95) ,即( 2973.05,3026.95) 全年牛奶总产量的置信区间为(7432625, 7567375) 7、上题中, 若 400 头奶牛中有80% 的是
15、优等奶牛, 试以 95% 的置信度估计全区优等奶牛的比 例的置信区间。 解: np =400 0.8=320,n(1-p)=400 0.2=80 都大于 5,因为 n/N=400/2500=0.16 0.05, 故需考虑用有限修正因子修正。所以根据公式 1 )1( 2/ N nN n pp zp = 12500 4002500 400 )8.01(8.0 96.18.0 =0.8 1.96 0.02 0.9167=0.81.96 0.02 0.9167=0.80.036 即( 0.764,0.836) ,也就是在95%的置信度区间内,全区优等奶牛的比例置信区间在 (76.4%, 83.6%)之
16、间。 11、 一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸的广告家庭占多大 比例。为了估计这个比例,首先要确定对多少个家庭做调查。该公司希望以90%的置信度 对这个比例作出估计,并使估计值处在真正比例附近0.04 范围之内。在一个有15 个家庭组 成的预备样本中,有35%的响应者指出他们家中某个人看过这种广告,试问应取多大的样 本。 解:由题意可得: 由于预备样本中n=15,是小样本,服从二项分布,所以: p=0.35 有04.0 p,1-=0.90 查表得 64.1 2 05.0 2 zz 所以应取样本数量 383 0016.0 65.035.069.2 04.0 )35.0
17、1(35.064.1 )1( 2 2 2 2 2 p pp n z 所以应抽取的样本数量为383 人。 第六章 7、糖厂用自动打包机打包,每包标准质量是100kg。每天开工后需要检验一次打包机工作 6 是否正常。某日开工后测得9 包质量如下: 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 ,已知包重服从正态分布,试检验该日打包机 工作是否正常。 (=0.05) 解:根据题意,设: 原假设: =100 备择假设: 100 有题中数据可知: n=9,S=99.98 S=1.212 由于 n30,所以构造t 统计量: 05.0 404.0 02.0
18、 3 212.1 10098.99 n S X t 查表可得 306.2)8() 19()1( 025.0 2 05.0 2 ttnt 因为 t=-0.0530.2)8( 025.0 t, 所以落在接受域内,接受原假设,拒绝备择假设,即: 在 95%的可靠程度内,该打包机该日的工作正常。 10、1545 名男性样本与1691 名女性样本用于比较双职工家庭中男女所做家务的数量, 研究表明67.5%的男性以及60.8%的女性认为自己那份家务是公平的。认为自己那份家务是 公平的男性的比率比女性的比率大吗?试用0.05 的显著性水平检验。 解:设男性的比率为1 p=67.5% 女性的比率为2p=60.
19、8% 根据题意,设: 原假设: p1= p2 备择假设: p1p2 有题中可知:n1=1545 n2=1691 =0.05 所以,得 64.0 3236 128.1028875.1042 16911545 608.01691675.01545 21 2211 nn pnpn p 构造 z 统计量: 965.3 0352.036.064.0 067.0 2 1 1 1 )(1( )21()21( nn pp pppp z 查表得 z0.05=1.64 由于 z=3.965z0.05=1.64,落在拒绝域内。所以拒绝原假设p1= p2, 接受备择假设p1p2 即在 0.05 的显著性水平上,认为自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 课后 作业题 哈尔滨工业大学 MBA 课程
链接地址:https://www.31doc.com/p-5229702.html