欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PDF文档下载
     

    sas编程习题与实例应用要点.pdf

    • 资源ID:5198086       资源大小:897.22KB        全文页数:19页
    • 资源格式: PDF        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    sas编程习题与实例应用要点.pdf

    1 一、数据集整理与 SAS 基本编程 1、试用产生标准正态分布函数的随机函数normal(seed )产生均 值为170,方差为 64的正态随机数 100个,并计算其常规统计量(均值、 标准差、变异系数、偏度和峰度) 。 data date1; mu=170 ; sigma=8; do i=1to100 ; y=mu+sigma*RANNOR(0); output ; end ; run ; procmeansdata =data1 meanstdcvstderrskewness; var y; outputout =result; run ; 2、设已知数据集 class 中有5个变量: name, sex, age, height 和weight ,请编写程序新建数据集class1 ,其中class1 只包含 name, sex, age 三个变量,且把 name 重命名为 id 。 data class; input name$ sex$ age heigh weigh; cards; 小明男 15 160 50 ; run ; data class1; 2 set class; keep name sex age; rename name=id ; run ; procprintdata =class1; run ; 3、SAS 的逻辑库可分为永久库和临时库两种,请编写一段程序 直接建立永久库 sasuser中的下例数据集,并按降序排序。 数据名 tong:20 13 20 16 23 19 19 16 data Sasuser.tong; input x; cards; 20 13 20 16 23 19 19 16 ; run ; procsortdata=Sasuser.tong; bydescending x ; run ; procprintdata =Sasuser.tong; run ; 4、设已知数据集data1 和数据集 data2 numberprovince 1Hebei 3Zhejiang 5Gansu 请编写程序串接 data1 和 data2 ,且分组变量为 number。 data data1; input number province$; cards; 1 Hebei 3 Zhejiang numbercity 2Chengdu 4Nanjing 3 5 Gansu ; run ; data data2; input number city$; cards; 2 Chengdu 4 Nanjing ; run ; data data; set data1 data2; by number; run ; procprintdata =data; run ; 二、描述统计 1、下表记录了某超市一个月内每天的营业额(千元) ,现用 SAS 过程做描述统计,请根据给出的结果回答以下问题: 日期营业额日期营业额日期营业额日期营业额日期 营业 额 1 6.14 7 14.76 13 42.41 19 11.13 25 33.87 2 48.35 8 39.18 14 30.21 20 1.07 26 20.09 3 0.95 9 36.87 15 15.62 21 17.12 27 34.73 4 18.61 10 15.64 16 40.47 22 8.33 28 43.86 5 37.89 11 30.44 17 8.81 23 8.59 29 7.56 6 3.48 12 23.38 18 2.5 24 4.08 30 23.44 (1) 、该超市一个月内的平均营业额,哪天最大、最小? (2) 、营业额的偏度、变异系数; 4 (3) 、数据是否服从正态分布?(0.05) data data1; input number province$; cards; 1 Hebei 3 Zhejiang 5 Gansu ; run ; data data2; input number city$; cards; 2 Chengdu 4 Nanjing ; run ; data data; set data1 data2; by number; run ; procprintdata =data; run ; data a; input date total; cards; ; procunivariatedata =a ; var total; run ; 5 2、假设某学校大学生的身高为X(记总体 X 的均值为 1,方差 为 2 1) ,体重为 Y (记总体 Y的均值为2,方差为 2 2) ,今从全校随机 抽取 100名学生,测得身高、体重数据如下,请根据输出结果回答以 下问题: 身高体重身高体重身高体重身高体重身高体重 172.4 75 169.3 54.8 169.3 64 171.4 64.8 166.5 47.4 171.4 62.2 168.2 66.9 165.1 52 168.8 62.2 167.8 65 165.8 62.2 167.8 65 164.4 58.7 169.9 57.5 164.9 63.5 160.3 55.2 175 66.6 172.5 73.5 172 64 168.4 57 155 57 175.5 63.9 172.3 69 168.6 58 176.4 56.9 173.2 57.5 167.5 50 169.4 52.2 166.7 72 169.5 57 165.7 55.4 161.2 48.5 172.8 57 175.1 75.5 157.5 50.5 169.8 62.9 168.6 63.4 172.6 61 163.8 58.5 165.1 61.5 166.7 52.5 170.9 61 166.1 69.5 166.2 62.5 172.4 52.6 172.8 60 177.8 63.9 162.7 56.8 168.8 54 169.1 66.2 177.5 60 177 66.2 169.9 55.9 167.4 54.4 169.3 58.4 172.8 72.8 169.8 58 160 65.3 179.1 62.2 172.3 49.8 163.3 46.5 172.9 66.7 165.4 58 175.8 63.2 162.3 52.2 165.4 65.7 171.5 59.3 176.6 66.3 181.7 68.6 175.2 74.9 169.5 59.5 169.6 61.5 169.1 63.1 185.5 77 173.9 65.5 162.5 50 171.5 58.5 175.6 59.8 166 75.5 167.2 63.3 171.9 57 176.6 58.4 177.3 67 169.2 71.8 166.2 49.8 181.7 63 175.8 68.3 172.3 55.5 172.7 58.5 174.3 64 171.2 59 174.8 68 165.4 55.5 169.1 64.8 167.9 62 6 176.8 64 183.5 69.9 165.5 48.6 171 70.5 170.3 58.5 1、身高、体重的均值 12 ,和方差 22 12 ,的 90% 的置信区间; data a; input heigh weigh; cards; ; run ; procttestdata =a alpha=0.1 ; run ; 169.31,171.0960.201,62.307 2、分析 100 名学生身高数据频率直方图; procgchartdata=a; vbar heigh/type=freq; run ; 3、对身高均值170cm和方差 22 30cm做假设检验; 7 0.70720.05 接受原假设 没有显著差异; 4、体重数据是否来自正态总体? procunivariatedata=a normal; var weight; run ; 样本少于 2000 看第一个大于2000 看第二个 因为0.4639大于0.05 所以接受原假设 所以来自正态总体 三、假设检验 1、某生产企业进行技术改造, 为考察改造是否对生产量有提高, 记录改造前后各 10 天的产量(吨 /天)的数据: 8 改 造 前 3.3 11.7 9. 4 6. 8 2 3.1 5.3 3.7 21.8 17.6 改 造 后 33 30.8 8. 8 11 .4 42.6 5.8 1.6 19 22.4 30.2 技术改造对产量是否有显著的影响(0.05)? data test; input a b; cards; run ; procttestdata =test; paired a*b; run ; 因为 0.03840.01,所以方差相等,看第一个equal,0.00240.05 接受原假设, A、B相互没有作用。 在 A品牌中分成两组, a2 和 a1、a3. 因为 a2 均值最大所以最好。 (如何判断看a1a3 可分成一组看上面那个表格第五行,只要差 值小于 1.4596,即可看成一组,两个效果差不多。 ) 同理, b4 最好。 若 A、B相互不影响,那么使产量最大的组合可直接选择A、B分 12 别均值最大那个,即a2*b4. 若 A、B相互影响,那么看这个表格均值最大那个。 2、考虑合成纤维收缩率(因子A)和总拉伸倍数(因子B)对纤维 弹性 Y的影响。设收缩率(A)有 4 个水平: A1,A2,A3 ,A4;总拉 伸倍数( B)也有 4 个水平 B1,B2,B3,B4。在每个组合下重复二次 试验,弹性的数据如下表: B1(=460) B2(=520) B3(=560) B4(=640) A1(=0)71,73 72,73 75,73 77,75 A2(=4)73,75 76,74 78,77 74,74 A3(=8)76,73 79,77 74,75 74,73 A4(=12)75,73 73,72 70,71 69,69 (1) 、 收缩率对弹性 Y是否有显著的影响?哪个收缩率影响更大 些?(0.05) (2) 、不同拉伸倍数对产量是否有显著的影响? (3) 、收缩率和拉伸倍数是否有交互作用? (4) 、使弹性达到最大的生产条件是什么? 13 五、回归分析 1、 某厂生产的一种产品的销售额Y与生产成本 1 x及销售成本 2 x有 关。现有 10 个城市销售数据记录如下, 1 x (元) 2 x (元) Y(个)1 x (元) 2 x (元) Y(个) 120 100 102 155 210 46 140 110 100 175 150 93 190 90 120 125 250 26 130 150 77 145 270 69 120 100 102 180 300 65 (1) 、建立销售量 Y与生产成本 1 x及销售成本 2 x的回归关系式, 说明回归方程在0.05的水平上是否显著?并 解释回归系数的含义 。 data sale; input x1 x2 y; cards; run ; procregdata=sale; model y=x1 x2 / r; run ; 14 因为 0.0078 小于 0.05,所以模型达到显著水平。 回归关系式 :y=79.88271+0.37176x1-0.31736x2 (2) 、对回归模型进行初步诊断, 并指出有无可疑点或异常点? 根据 Student Residual 或 星星判断,得观测1、8、9 的残差 较大,说明这三个模型的预测结果不是很理想。 (3) 、写出模型的决定系数、均方误差、均方误差的根,并说明 决定系数的含义。 决定系数: R-Square=0.74990.5,说明多元回归模型的拟合程 度较好。 均方误差: Mean Square Error =270.21070 均方误差的根: Root MSE=16.43809 (4) 、 该回归模型回归系数是否显著?可以从哪些方面对模型进 行改进? X1的回归系数 p 值=0.12650.05 ,不显著。 X2的回归系数 p 值=0.00290.05, 显著。 (5) 、如果 1 170x元及 2 160x元,试预测该厂的销售量。 15 代进去。 2、某地区对某种电器的销售量Y 进行调查,它与以下4 个量有 关: 1 x=居民可支配收入, 2 x=该电器平均价格指数, 3 x=该电器保有 量, 4 x=其他电器平均价格指数。现有10 个历史数据记录如下, 1 x 2 x 3 x 4 x Y1 x 2 x 3 x 4 x Y 82.992 17.1948.4131 101 40 101 14.2 8893 21.3969.6148.2 105 44 104 15.8 99.996 25.19710.4 161.8 112 49 109 17.9 105.394299711.4 174.2 112 51111 19.6 117.7 10034 100 12.2 184.7 112 53111 20.8 (1) 、建立销售量Y 与 14 xx的回归关系式,说明回归方程在 0.05的水平上是否显著? (2) 、对回归模型进行初步诊断, 并指出有无可疑点或异常点? (3) 、写出模型的决定系数、均方误差、均方误差的根,并说明 决定系数的含义。 (4) 、该回归模型回归系数是否显著?可以从哪些方面对模型进 行改进? 六、属性数据分析 1、下表是对 195 名顾客的购买手机意愿(分为品牌机、山寨机、无 所谓)的调查数据,同时记录了每位顾客的年收入经济状况(分为贫 穷、下、中、上四个等级) 。 贫穷下中上 16 山寨机30 15 11 12 品牌机7 18 19 29 无所谓5 23 7 19 请问购买何种手机是否与顾客的经济状况有关(0.01)?如果有关 两者有何趋势? data test; input a$ b$ x; label a= ' 购买手机意愿' b= ' 经济状况 ' ; cards; 品牌机贫穷30 品牌机下 15 品牌机中 11 品牌机上 12 山寨机贫穷7 山寨机下 18 山寨机中 19 山寨机上 29 无所谓贫穷5 无所谓下 23 无所谓中 7 无所谓上 19 ; run ; procfreqdata=test; table a*b/expectedchisqnorowmeasuresnopercentalpha=0.01; weight x; run ; 17 18 2、巴西医生马廷思收集了580名犯有各种贪污、 受贿罪的官员和 580 名廉洁官员之寿命调查数据,试分析贪污与寿命之间有无显著的关 系? 短寿长寿合计 贪官348 232 580 清官93 487 580 合计441 719 1160 请问短寿是否与贪污有关?如果有关两者有何趋势? 19

    注意事项

    本文(sas编程习题与实例应用要点.pdf)为本站会员(tbuqq)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开