《预测论文静静.doc》由会员分享,可在线阅读,更多相关《预测论文静静.doc(11页珍藏版)》请在三一文库上搜索。
1、院 (系) 统计学院 专 业 统计学 班 级 08级统计班 学 号 2008121138 姓 名 张静 指导教师 朱梅红 2011年 5 月 8 日中国各城市排水和污水处理情况的预测与分析摘要:水是人类及一切生物赖以生存和发展的基本物质之一,同时也是工农业及社会可持续发展不可替代的极为宝贵的自然资源。近几年,随着城市化进程加快,我国许多城市严重缺水,特别是在工业和人口过度集中的大都市。城市日益严重的水资源短缺和水环境污染问题不但严重影响到国计民生,而且已经成为制约社会经济可持续发展的主要因素。所以,城市的污水处理能力就尤为重要。关键词:污水处理 多元回归分析 二次指数滑动平均法 灰色预测一、
2、研究背景及数据:表一是中国历年城市排水和污水处理情况统计表,通过对排水管道长度、污水年排放量、污水处理厂的座数,处理能力和国内生产总值几个方面来研究城市处理污水的能力。本文采用多元回归、二次指数滑动平均法和灰色预测等方法来对城市处理污水的能力进行预测和分析研究。中国历年城市排水和污水处理情况统计年份指标排水管道长度(公里)污水年排放量(万立方米)污水处理厂座数(座)处理能力(万立方米)国内生产总值(元)污水年处理总量(万立方米)污水处理率 19926160129970348731721781.544535514.86199367672301773110036626923.552162317.2
3、9199475207311342010844935333.962316320.02199583647303008213954048197.951801317.11996110293350255314171460793.768968619.6919971128123528472309115371176.683344623.6219981197393514011307129278973.090792825.8419991259433562912398158384402.3105334229.5620001344863556821402176789677.1113553231.93200114175
4、83317957427215899214.6113560834.25200215812832858504523106109655.2119696036.43200317304233759595373578120332.7134937739.97200419864534916166124254135822.8147993242.39200521888135646017084912159878.3162796645.67200624105635951627925725183217.4186761551.95200726137936252818156366211923.5202622455.6720
5、0829193336101188837146257305.6226984762.872009315220364878210188106300670.0256004170.162010343892371212912149052335353279345775.25表(一)二、 研究问题的方法及模型的建立:本文采用多元回归方法、二次滑动平均法以及灰色预测等方法来研究污水处理能力的预测问题。(一)首先采用的是多元回归方法多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 一个线性回归方程通过
6、了t检验或F检验,只表明变量x与y之间的线性关系式显著的,或者说线性回归方程是有效的,但不能保证数据拟合得很好,也不能排除由于意外原因导致数据不完全可靠,比如有异常值出现,有周期性因素干扰等。只有当与模型中的残差项有关的假定满足时,我们才能放心地运用回归模型。因此,在利用回归方程作分析和预测之前,应该用残差图帮助我们诊断回归模型效果以及样本数据的质量,检查模型是否满足基本假定,以便对模型作进一步的修改。残差图指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。如在分析测试中常用的散点图是以自变量为横坐标的残差图,可用它来检查回归线的异常点“残差图”以回归方程的自变量为横坐标,以残差为纵坐标,
7、将每一个变量的残差描在该平面坐标上所形成的图形。当描绘的点围绕残差等于0的直线上下随机散步,说明回归直线对原观测值的拟合情况良好。否则,说明回归直线对原观测值的拟合不理想。从“残差图”可以直观地看出残差的绝对数值都比较小,所描绘的点都在以0为横轴的直线上下随机散布,回归直线对各个观测值的拟合情况是良好的。说明变量X与y之间有显著的线性相关关系。下面五个图片是残差图:从上面的残差图中可以看出,X1,X3,X4,X5残差落在变化幅度不大的一条带子内,说明回归模型满足基本假设。而X2存在异常点。 下表示运用SPSS软件对数据做相关分析。用SPSS软件计算增广矩阵,自变量的偏相关矩阵。从相关矩阵看出,
8、Y与X1,X3,X4,X5的相关系数都在0.9以上,说明所选的自变量是与 Y高度线性相关的,Y与X3的相关系数是0.762也是很高的,说明Y与自变量做多元线性回归是适合的。表二示运用SPSS软件对数据做相关分析。用SPSS软件计算增广矩阵,自变量的偏相关矩阵。从相关矩阵看出,Y与X1,X3,X4,X5的相关系数都在0.9以上,说明所选的自变量是与 Y高度线性相关的,Y与X3的相关系数是0.762也是很高的,说明Y与自变量做多元线性回归是适合的。表(二)下面的表三是运用excel软件对数据进行多元回归分析,从表中可以看出决定系数,调整后的,从决定系数可以看出回归方程显著。从方差分析表可以看出,F
9、=693.4106,说明X1,X2,X3,X4,X5整体上对Y有高度显著的线性影响。表(三)从表(四)可以看出,回归系数t检验,由于,可以看出只有X3,X5通过了检验。因此要进行模型重建。表(四)因此,重新建立模型的的残差图以及相关检验结果如下:模型重建后,看各项的检验均通过,最后得出预测方程和预测的结果如下。最后计算MAP的值,得到MAP=0.03945(二)然后本文采用二次滑动平均法,同移动平均相似,如果某一时间序列没有明显的变动趋势,使用第t周期一次指数平滑法也能直接预测第t+1期之值。但当时间序列的变动出现线性趋势时,同移动平均一样,用一次指数平滑法来预测仍存在着明显的滞后偏差,因此,
10、一次指数平滑法也需要进行修正。修正的方法也是在一次指数平滑的基础上再作二次指数平滑,利用滞后偏差的规律找出曲线的发展方向和发展趋势,然后建立直线趋势预测模型,故称二次指数平滑法。二次指数平滑的模型公式如下:若时间序列从某时期开始具有直线趋势,且认为未来时期亦按此直线趋势变化,则与趋势移动平均类似,可用如下的直线趋势模型来预测:式中t为由当前周期数t到预测期的周期数,即t以后模型外推的时间;为第t+T周期的预测值; 为截距; 为斜率。 又称为平滑指数。根据指数滑动平均的计算公式,可得到:首先,针对二次指数滑动平均的特点,在时间序列有明显线性趋势时,指数滑动平均的效果较好。预测污水年处理量,先做一
11、次滑动平均折线图。结果如下:从一次滑动平均折线图,可以观察出整个折线都处于实际值的右侧,用此模型进行预测会有滞后效应,因此,此处进行第二次指数滑动平均。结果如下图:从二次滑动平均折线图可以看出,二次滑动平均的预测的效果很好。根据趋势移动平均的预测模型,可求解两个参数的最终值如下: 直线趋势预测模型中T=1,其具体方程应该为如下(三)最后本文采用灰色预测是对既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。尽管灰色过程中所显示的现象是随机的,但毕竟是有序的,因此,这一数据集合具备潜在的规律,灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行
12、关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势。灰色预测等时距观测的反映预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。1. GM(1,1)模型的建立时间序列有19个观察值,,通过累加生成新序列,则GM(1,1)模型相应的微分方程为:,其中,a称为发展灰数,称为内生控制灰数。为待估参数向量,利用最小二乘法求解,可得:,其中 求解微分方程,即可得到预测模型:所以通过对数据的计算可得:所以微分方程,即可得预测模型:2. 模型检验:灰色预测检验一般包括残差检验、关
13、联度检验和后验差检验。(1) 残差检验:按预测模型计算,并将累减生成,计算原始序列与的绝对误差序列及相对误差序列。0.036,428181,520142,404430,564458,695380,755707,885515,950499,931605,972043,1101401,1206533,1326538,1535284,1659822,1865881,214660,23034140.81,0.82,0.83,0.78,0.81,0.83,0.83,0.84,0.83,0.82,0.81,0.82,0.82,0.81,0.82,0.82,0.82,0.83,0.83相对误差基本大于0.8
14、,说明模型预测精读不高。关联度检验: 计算关联度:后验差检验:-1064236,-656055,-544094,-499778,-368856,-178721,-113737,-132631,-92193,37164,142296,262301,471047,595585,801643,1050422,1238177=707895.239 =613128.8188 C=0.0866 =0.674=477475.3387不是所有e都小于S0 说明模型的预测精度太低,说明此数据不适合做灰色预测。三、 结论与建议 从多元回归的方法及结论可以看出,污水厂的座数和国内生产总值对污水的年处理量影响较大,通
15、过多元回归分析和二次指数平滑法做的预测分析,得到对2010年的年污水处理量的预测值在28778432906402左右。通过分析得出,我们加大污水厂的座数和提高国内生产总值有利于对污水的处理,通过对得出的预测数据分析,污水年处理量成上升趋势。综合以上三种方法,可以看出灰色预测模型的检验不通过,所以此问题不适合运用灰色预测方法来做分析和预测。多元回归方法和二次指数平滑法方法均通过各个统计检验,具有实际经济意义。本文对多元回归方法和二次指数平滑法得到的预测结果进行分析比较,通过MAP的大小来比较,由于,MAP的值越小,说明越测的效果越好,多元回归方法的预测结果得到的MAP=0.03945,二次指数平滑法的预测结果得到的MAP=0.131152。通过比较两种方法得到的MAP值的大小可以看出运用多元回归方法进行预测,得到的预测效果较好。参考文献:1. 中国城乡建设统计年鉴2. 统计预测和决策 徐国祥主编3. Excel统计分析典型实例 马禄义主编4. 水资源利用与环境保护工程 刘满平主编
链接地址:https://www.31doc.com/p-2718494.html