《Logistic模型应用剖析.pdf》由会员分享,可在线阅读,更多相关《Logistic模型应用剖析.pdf(8页珍藏版)》请在三一文库上搜索。
1、基于 logistic模型的 2014 年影响中国各省城市化水平的 经济地理因素分析 摘 要:本文利用 2013 年中国 31 个省份的数据,从经济与地理位置 两个因素出发,运用logistic回归的方法在 SPSS 软件上进行分析。 结果显示:中国城市化发展水平不仅与经济密切相关,而且与其地理 位置也有很大的关系, 地区间城市化发展水平差距较明显,城市化各 方面的因素水平发展不平衡。 关键词 :logistic模型,城市化水平, SPSS软件 目 录 一、 引言 3 二、 Logistic 模型 3 1. 基本概念 3 2. 统计原理 4 (1) logit 变换 4 (2) Logisti
2、c 回归模型 . 4 (3) 统计检验 . 4 三、基于logistic模型的我国各省城市化水平影响因素实证分析. 5 1数据来源与说明. 5 2模型检验 . 5 3模型的建立与预测. 6 四、结论 7 参考文献 8 一、引言 城市化的定义众多, 本文参照中华人民共和国国家标准城市规 划术语 ,认为城市化是“人类生产与生活方式由农村型向城市型转 化的历史过程,主要表现为农村人口转化为城市人口及城市不断发展 完善的过程。”城市化是一个系统的动态过程,包含了人口、经济、 社会、城市建设等各方面变化的影响。它是经济发展和社会进步的必 然结果,反过来也推动了经济的发展和社会的进步。 中国大陆的城市化进
3、程在不同的时期具有不同的特点,总的来看 城市化水平普遍较低, 并已成为制约国家经济、 社会和谐发展的主要 原因之一。因而, 各地区普遍把推进城市化进程作为经济、社会发展 战略的一项重要目标选择。 当前中国大陆已经进入了城市化水平的持 续上升发展时期,此时对这样一个过程实施有效、客观、科学、动态 的监测,从而及时发现并解决城市化进程中出现的难题,就必须加强 对中国大陆城市化水平质与量等方面的考察和研究。这对于我们这样 一个人口众多、区域经济发展不平衡的国家尤为重要。 本文不仅分析影响城市化水平的经济因素,还加入了地理位置对 其城市化发展的影响。 由于地理因素数据不是数值型变量,因此我们 引用 l
4、ogistic 回归方法对其进行建模。 二、Logistic模型 1.基本概念 Logistic 回归分析就是针对因变量是定型变量的回归分析,这与 一般的回归分析不同。 在实际生活中, 我们会经常遇到因变量是定型 变量的情况,这是需要使用Logistic 回归进行分析。 2.统计原理 (1)logit 变换 设因变量y是只取 0 或 1 的而分类变量 ,p为某事件发生的概率, 取值区间为1 ,0,当时间发生时1y,否则0y,即)1(yPp是研究 对象。将比率 )1/(pp取自然对数,即对p做 logit 变换: )1/ln()(logpppit 当1p时)(logpit, 当5 .0p时0)(
5、logpit, 当0p时 )(logpit,故)(logpit的取值范围为),(。 (2)Logistic 回归模型 设有k个因素 k xxx, 21 影响y的取值,则称 ),() 1 ln( 321 xxxg p p (1) 为二维 Logistic 回归模型,简称Logistic 回归模型,其中的k个因素 k xxx, 21 称为 Logistic 回归模型的协变量。最重要的Logistic 回归模 型是 Logistic 线性回归模型: kkx x p p 110 ) 1 ln((2) 式中, k , 10是待估计的未知参数。可得 )exp(1 )exp( 110 110 kk kk x
6、x xx p(3) (3)统计检验 在Logistic回 归 中 常 用 的 检 验 有 -2对 数 似 然 检 验 (-2log(likelihood),-2LL ) ,Hosmer和 Lemeshow的拟合优度检验,Wald 检验等。 三、基于 logistic模型的我国各省城市化水平影响因素实证分析 1数据来源与说明 研究 2014 年我国各省城市化水平的经济地理因素。数据来源于 2014年中国统计年鉴。城市化水平用城镇人口比重表示,影响因 素包括人均 GDP 与地理位置。 地理位置为名义变量, 中国各省被分为 三大地带:东部、 中部和西部。我们用各地区的地带分类代表地理位 置。 2模型
7、检验 根据全国各省城市人口比重的平均值53.73作为临界值,大于等 于 53.73地区的城市化水平用Y 表示,小于 53.73地区的城市化水平 用 N 表示。在 SPSS中,Y 用 1 表示,N 用 0 表示。自变量中涉及到 代表不同地区类型的名义变量, 属于中部的用 1 表示, 否则用 0 表示。 而在 SPSS分析中, 0 代表属于中部地区, 1 代表不属于中部地区。 表1 方程中的变量 B S.E, Wals df Sig. Exp (B) 步骤 0 常量-.194 .361 .289 1 .591 .824 从表1可以看出最开始对常数项赋值,结果为B=-0.194,标准误 差为S.E.
8、=0.361,则Wald值为 22 0.289 0.194 0.361 Wald B S E 则()0.824 B Exp B e 表2 模型系数的综合检验 卡方df Sig. 步骤 1 步骤42.684 2 .000 块42.684 2 .000 模型42.684 2 .000 本检验主要是针对步骤、 模块和模型系数的综合性检验,共采用 了三种检验方法, 分别是步与步间的相对似然比检验、块间的相对似 然比检验和模型间的相对似然比检验。从表2可以看出各卡方值远远 大于临界值, 并且其相应的 P值都小于 0.05,因此在显著性水平为 0.05 的情况下,都通过了检验。 表3 Hosmer和Lem
9、eshow 检验 步骤卡方df Sig. 1 .000 1 1.000 Hosmer-Lemeshow 检验,该检验要求其卡方值低于临界值。从 表3可以看出,取显著性水平 0.05,其卡方值远远小于临界值,并且 其对应的 P值也大于 0.05,据此可以判断 Hosmer-Lemeshow 检验可以 通过。 表4 Hosmer和Lemeshow 检验的随机性表 城市化 = N 城市化 = Y 总计已观测期望值已观测期望值 步骤 1 1 15 15.00 0 .000 15 2 2 2.000 1 1.000 3 3 0 .000 13 13.00 13 因变量城市化水平有两类数值,即0和1。在正
10、常情况下,要求观 测值和期望值逐渐趋于接近。根据表4,我们可以看出,观测值与期 望值是相近的。则 Hosmer-Lemeshow 检验的结果是理想的,模型的 整体拟合效果较好。 3模型的建立与预测 表5 方程中的变量 B S.E, Wals df Sig. Exp (B) 步骤 1 a 中部 (1) -1116.140 13700.106 .007 1 .935 .000 人均 GDP .190 1.814 .011 1 .917 1.209 常量-6990.182 67202.149 .011 1 .917 .000 a. 在步骤 1 中输入的变量: 中部 , 人均 GDP. 根据表 5,建
11、立如下线性关系: ln()6990.180.19*1116.14* 1 p GDP p 人均中部 则有 0.19*1116.14* 0.19*1116.14* ( ) 1 GDP GDP p y e e (人均中部-6990.18 ) (人均中部 -6990.18 ) 根据上式,就可以对因变量城市化的发生概率进行预测。 四、结论 本文介绍了 Logistic的基本理论及应用意义, 结合SPSS 软件给出了 Logistic的具体应用,得出的结论精确度较高,可以用于预测。结果 发现城市化不仅受到经济因素的影响,而且地理位置对城市化的影响 因素也很大。 参考文献 1 李振福 .长春市城市人口的 Logistic模型预测 J.吉林师范大学学 报:自然科学版, 2003,24(1):16-19. 2 胡喜生,范海兰,宋萍等.改进Logistic模型在城市人口预测中的 应用J.北华大学学报, 2008,9(4). 3 阎慧臻 .Logistic模型在人口预测中的应用J.大连工业大学学报, 2008,27(4). 4 杜强,陈乔等 .基于Logistic模型的中国各省碳排放预测J.长江流 域资源与环境, 2013,22(2).
链接地址:https://www.31doc.com/p-4700971.html