spss多元线性回归实例要点.pdf
《spss多元线性回归实例要点.pdf》由会员分享,可在线阅读,更多相关《spss多元线性回归实例要点.pdf(16页珍藏版)》请在三一文库上搜索。
1、SPSS19.0 实战之多元线性回归分析 (2011-12-09 12:19:11) 转 载 标签: 文化 分类:软件介绍 线性回归数据( 全国各地区能源消耗量与产量)来源,可点击协会博客数据挖 掘栏:国泰安数据服务中心的经济研究数据库。 1.1 数据预处理 数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和 变换,数据归约, 数据离散化等。 本次实习主要涉及的数据预处理只包括数据清 理和描述性数据汇总。 一般意义的数据预处理包括缺失值填写和噪声数据的处 理。于此我们只对数据做缺失值填充,但是依然将其统称数据清理。 1.1.1数据导入与定义 单击“ 打开数据文档” ,将 x
2、ls 格式的全国各地区能源消耗量与产量的数据导入 SPSS中,如图 1-1 所示。 图 1-1 导入数据 导入过程中, 各个字段的值都被转化为字符串型(String),我们需要手动将相 应的字段转回数值型 。 单击菜单栏的 “ ”“ ”将所选的变量改为数值型。 如图 1-2 所示: 图 1-2 定义变量数据类型 1.1.2数据清理 数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据 完整性。单击 “ ”“ ”,将检查所输入的数据的缺失值个数以及百分比等。如图 1-3 所示: 图 1-3 缺失值分析 能源数据缺失值分析结果如表1-1 所示: 单变量统计 N 均值标准差 缺失
3、极值数目 a 计数百分比 低高 能源消 费总量 30 9638.50 6175.924 0 .0 0 1 煤炭消 费量 30 9728.99 7472.259 0 .0 0 2 焦炭消 费量 30 874.61 1053.008 0 .0 0 2 原油消 费量 28 1177.51 1282.744 2 6.7 0 1 汽油消 费量 30 230.05 170.270 0 .0 0 1 煤油消 费量 28 45.40 66.189 2 6.7 0 4 柴油消 费量 30 392.34 300.979 0 .0 0 2 燃料油 消费量 30 141.00 313.467 0 .0 0 3 天然气
4、 消费量 30 19.56 22.044 0 .0 0 2 电力消 费量 30 949.64 711.664 0 .0 0 3 原煤产 量 26 9125.97 12180.689 4 13.3 0 2 焦炭产 量 29 1026.49 1727.735 1 3.3 0 2 原油产 量 18 1026.48 1231.724 12 40.0 0 0 燃料油 产量 25 90.72 134.150 5 16.7 0 3 汽油产 量 26 215.18 210.090 4 13.3 0 2 煤油产 量 20 48.44 62.130 10 33.3 0 0 柴油产 量 26 448.29 420.
5、675 4 13.3 0 1 天然气 产量 20 29.28 49.391 10 33.3 0 3 电力产 量 30 954.74 675.230 0 .0 0 0 表 2-1 能源消耗量与产量数据缺失值分析 表 1-1 能源消耗量与产量数据缺失值分析 SPSS提供了填充缺失值的工具, 点击菜单栏 “ ”“ ”,即可以使用软件提供的几 种填充缺失值工具,包括序列均值,临近点中值,临近点中位数等。结合本次实 习数据的具体情况,我们不使用SPSS软件提供的替换缺失值工具,主要是手动 将缺失值用零值来代替。 1.1.3描述性数据汇总 描述性数据汇总技术用来获得数据的典型性质,我们关心数据的中心趋势和
6、离中 趋势,根据这些统计值, 可以初步得到数据的噪声和离群点。中心趋势的量度值 包括: 均值( mean ),中位数( median),众数( mode)等。离中趋势量度包 括四分位数( quartiles),方差( variance)等。 SPSS提供了详尽的数据描述工具, 单击菜单栏的 “ ”“ ”“ ”,将弹出如图 2-4 所示的对话框, 我们将所有变量都选取到, 然后在选项中勾选上所希望描述的数 据特征,包括均值,标准差,方差,最大最小值等。由于本次数据的单位不尽相 同,我们需要将数据标准化,同时勾选上“ 将标准化得分另存为变量” 。 图 1-4 描述性数据汇总 得到如表 1-2 所示
7、的描述性数据汇总。 N 极小 值极大值 均值标准差方差 能源消 费总量 30 911 26164 9638.50 6175.924 38142034.412 煤炭消 费量 30 332 29001 9728.99 7472.259 55834651.378 焦炭消 费量 30 19 5461 874.61 1053.008 1108824.853 原油消 费量 30 0 5555 1099.01 1273.265 1621202.562 汽油消 费量 30 18 771 230.05 170.270 28991.746 煤油消 费量 30 0 262 42.37 64.896 4211.520
8、 柴油消 费量 30 27 1368 392.34 300.979 90588.441 燃料油 消费量 30 0 1574 141.00 313.467 98261.261 天然气 消费量 30 1 106 19.56 22.044 485.947 电力消 费量 30 98 3004 949.64 711.664 506464.953 原煤产 量 30 0 58142 7909.17 11741.388 1.379E8 焦炭产 量 30 0 9202 992.28 1707.998 2917256.193 原油产 量 29 0 4341 637.12 1085.379 1178048.432
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 多元 线性 回归 实例 要点
链接地址:https://www.31doc.com/p-5198185.html