Hopfield 网络在年用电量预测中的应用研究.doc
《Hopfield 网络在年用电量预测中的应用研究.doc》由会员分享,可在线阅读,更多相关《Hopfield 网络在年用电量预测中的应用研究.doc(8页珍藏版)》请在三一文库上搜索。
1、精品论文推荐Hopfield 网络在年用电量预测中的应用研究刘武寅 辽宁工程技术大学理学院,辽宁阜新 (123000) E-mail: 摘要:该文将偏最小二乘回归模型(Partial Least Square Regression,PLS)应用于年用电量预测,并与基于最小二乘的多元线性回归模型预测成果进行对比,探讨了偏最小二乘法在电 力负荷预测中的可行性和优势。通过四川省电网年用电量预测表明:偏最小二乘回归法比一般最小二乘法优,具有较强的实用性。关键词:电力系统;多元线性回归;偏最小二乘;最小二乘1. 引言西电东送,必须预测西部本身的用电量。准确的负荷预测, 可经济合理地安排电网内 部发电机组
2、的生产计划, 保持电网运行的安全可靠, 降低发电成本,提高经济和社会效益。 但年用电量受人口、 国民生产总值、第一生产值、第二生产值及第三生产值影响。这些影 响因素之间存在严重的多重相关性。为了提高负荷预报精度,电力工作者作了大量的研究工作,尝试了各种预测方法13。 回归分析法在电力负荷预测中有着广泛的用途。 在建立自变量集合与因变量间的回归方程 中,一般常用最小二乘法,但若自变量间存在多重相关性时, 该法估计结果误差较大且不 稳定。 在这种情况下,应用新的估计方法是十分必要的。瑞典化学家 S.Wold 教授提出的被称为第二代回归分析的偏最小二乘回归是一种新的 多元统计数据分析方法。它是多元线
3、性回归、 典型相关分析和主成分分析的有机结合4, 较传统的回归分析、主成分回归具有更大的优势,从而使模型精度、稳健性、实用性都得到 提高。2. 偏最小二乘回归模型42.1 概述在一般多元线性回归模型中,有一组因变量Y = y1 , y2 ,L, y p ( p 为因变量个数)- 8 -和自变量 X= x1 , x2 ,L, xn ( n 为自变量个数),当数据总体满足高斯马尔科夫定理时,由最小二乘法有 B = X ( X T X ) 1 X T Y ,式中 B 为估计的回归系数。当 X 中的变量存在严重的多重相关性(变量本身物理意义决定了它们之间的相关性,或 由样本点数量不足造成),行列式(
4、X T X )几乎接近于零,求解 ( X T X ) 1 时会含有严重的舍 入误差,使回归系数估计值的抽样变异性显著增加。更有甚者,当中的变量 X 完全相关时,( X T X ) 是不可逆矩阵,无法求解回归系数。此时,若仍沿用最小二乘法拟合回归模型, 回归结果将会出现许多反常现象,致使其精度、可靠性得不到保证。在实际工作中,变量的 多重相关性是普遍存在的。偏最小二乘法就能较好地解决这类问题。2.2 偏最小二乘回归模型的思路偏最小二乘回归是多元线性回归、典型相关分析和主成分分析的集成和发展。其思路是: 首先,从自变量集合 X 中提取成分 t h ( h = 1,2,L ),各成分相互独立;然后,
5、建立这些成分与自变量 X 的回归方程,其关键在于成分的提取。与主成分回归不同的是,偏最小二乘回归所提取的成分既能很好地概括自变量系统中的信息,又能最好地解释因变量,并排除系 统中的噪声干扰。因而有效地解决了自变量间多重相关性情况下的回归建模问题。2.3 偏最小二乘回归模型的建模步骤2.3.1 原始数据标准化将原始自变量数据表 X = ( xij )n p 和因变量数据表Y = ( yij )nq 进行标准化处理,得到标 准化矩阵 E0 = (eij ) n p , F0 = ( f ij ) nq ,其中xij x jeij =sx j, i = 1,2,L, n; j = 1,2,L, p
6、,(2-1)fijy y= ijj , i = 1, 2,L, n; j = 1, 2,L, q ,(2-2)sy jx j 、 y j 分别为矩阵 X 与 Y 的第 j 列数据的平均值,sx j 、sy j 为矩阵 X 与 Y 的第 j 列数 据的标准差。2.3.2 主成分提取2.3.2.1 第一轮主成分提取TT求矩阵 E0 F0 F0 E0 的最大特征值所对应单位特征向量 w1 ,得自变量的第 1 个主成分t1 = E0 w1 .TT求矩阵 F0 E0 E0 F0 的最大特征值所对应单位特征向量 c1 ,得因变量的第 1 个主成分u1 = F0 c1 .求残差矩阵E1 = E0p t1T1
7、 ,(2-3)1 1F1 = F0 t r T ,(2-4)式(2-3)中 pE T t=0 1 ,式(2-4)中 r2F T t=0 1 .121t1t1在 PLS 方法中称 w1 为模型效应权重, c1 为因变量权重, p1 为模型效应载荷量。2.3.2.2 新一轮主成分提取令 E0 = E1 ,F0 = F1 ,回到第 a 步,对残差矩阵进行新一轮的主成分提取和回归分析。 设第 h 步的计算结果为th = Eh 1 wh ,(2-5)u h = Fh 1 ch ,(2-6)hh 1h hE = E t p T ,(2-7)F = F t rThh 1h h,(2-8)E T tF T t
8、式(2-5)至(2-8)中, h = 1,2, L , m, m rankE0 , ph =h 1 h2t h, rh =h 1 h .2t h2.3.2.3 主成分提取终止准则判断的准则常用的有交叉有效性准则和复测定系数准则。本文将采用交叉有效性准则5,6。复测定系数准则可参考文献5。把所有 n 个样本点分成两个部分:第一部分是除去某个点 i 的所有样本点集合(共 n 1个样本点),用这个部分样本点并使用 h 个成分拟合一个回归方程;第二部分是把刚才被排除的样本点 i 代入前面拟合的回归方程,得到 y j 在样本点 i 上的拟合值,记为 y hj ( i ) 对于每一个 i = 1,2,L,
9、 n ,重复上述测试,即可以定义 y j 的预测误差平方和为 PRESS hj ,有PRESS hjn= ( yiji =1 y2hj ( i ) ),(2-9)定义 y 的预测误差平方和为 PRESSh ,有pPRESS h = PRESS hj .(2-10)i =1另外,再采用所有的样本点,拟合含 h 个成分的回归方程这时,记第 i 个样本点的预测值为 y hji ,则可定义 y j 的误差平方和为 SS hj ,有SS hj= ( yijyhji) 2 ,(2-11)定义Y 的误差平方和为 SSh ,有对每个因变量 yk ,定义pSS h = SS hj .(2-12)i =1Q 2
10、= 1 PRESS hk hkSS,(2-13)( h 1) k对于全部因变量Y ,成分 th 的交叉有效性定义为q PRESS hkPRESSQ 2 = 1 k =1 = 1 h .(2-14)hq SS ( h 1)k =1SS ( h 1)当 Q 2 (1 0.952 ) = 0.0975 时,认为 t 的成分的边际贡献是显著的hh2.3.3 建立回归方程2.3.3.1 建立数据标准化后的 PLS 回归方程将 t = Ew = E w * (i = 1,2,L, m) 代入方程ii 1 i0 i1 1rr0TTF = t r T+ t 2 2+ L + t m m+ Fm,(2-15)得
11、 F0 关于 E0 的 PLS 回归方程F = Ew* r T+ E w* r T+ L + Ew* r T + F,(2-16)i 100 1 10 2 20 m mm其中 w* = (I wp )w , i = 1,2, L , m ,为单位矩阵。ik =1kki2.3.3.2 关于原始变量的 PLS 还原方程将方程还原成 (2-21)关于原始变量的 PLS 回归方程y k= ( y kp kisy kxi )p+ kisy kxi , k= 1,2, L , q ,(2-17)i =1sxii =1sxi其中 k 是矩阵 pqm*= w j r j 的第 k 个列向量, 是 的第 i 个
12、分量。j =1kik3偏最小二乘回归模型在年用电量预测中的应用3.1 基本资料本文收集了四川省 19781998 年年用电量及其影响因素的资料7, 见表 1。 表中电量 单位为亿 kWh,人口单位为万人, 产业值单位为亿元。影响年用电量(自变量)的因子有国 民生产总值 x1,第一产业生产值 x2, 第二产业生产值 x3, 第三产业生产值 x4 和总人口 x5。 用 19781993 年资料建模,19941998 年资料进行检验。表 1 四川省年用电量及其影响因子的基本资料年份x1x2x3x4x5年用电量1978185.7682.2065.5538.017071.980.131979205.76
13、91.9572.3141.507120.590.781980229.31101.6881.0546.587154.893.951981242.32108.0283.3650.947215.694.251982275.23125.3692.8457.037300.4100.291983311.00138.17105.6967.147336.9108.151984358.05156.11121.6880.277364.0116.371985421.15172.90148.11100.147419.3124.921986458.23181.20160.62116.417511.9129.831987
14、530.86202.25187.88140.737613.2151.121988659.69241.95238.32179.427716.4159.921989744.98263.15266.16215.677803.2172.671990890.95321.41313.64255.907892.5177.1119911016.31339.00378.48298.837947.8188.1519921177.27372.04441.57363.667992.2194.3719931486.08449.38580.38456.328037.4218.9119942001.41597.37802.
15、77601.278098.7247.5519952504.95725.461020.91758.588161.2273.5019962985.15860.021229.01896.128215.4292.1019973320.11919.281385.381015.458264.7299.1719983580.26941.241527.071111.958315.7304.083.2 多重相关性检验计算自变量、因变量间的相关系数,见表 2。从表 2 中可以得出各自变量之间的相关系 数最高达 0.999,最低达 0.932。而因变量与自变量之间的相关系数最高大 0.990,最低达 0.960。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hopfield 网络在年用电量预测中的应用研究 网络 用电量 预测 中的 应用 研究
链接地址:https://www.31doc.com/p-3618896.html