数学建模论文上海股市指数研判分析及预测.doc
《数学建模论文上海股市指数研判分析及预测.doc》由会员分享,可在线阅读,更多相关《数学建模论文上海股市指数研判分析及预测.doc(42页珍藏版)》请在三一文库上搜索。
1、上海股市指数研判分析及预测摘要我国股票市场已成为证券业和金融业必不可少的重要组成部分,许多学者提出了各种各样的方法研究股票市场的规律。本文对沪(深)股市指数涨跌指标进行分析,并对上海股市指数预测问题进行了详细地探究。针对问题一,首先确定了影响股市指数涨跌的8个指标分别为KDJ.%K、 KDJ.%D、KDJ.%J、KLINE、SHORT.SHT 、LONG.LON、VOL.VOL和MA,以收盘价为因变量,各指标为自变量,建立主成分分析模型,并借助SPSS软件分析得出:应选取KJD.K,KLINE.5MA,SHORT.SHT作为主要的影响因素,占到了所有影响因素的98.1%。因此,研判出上海股市指
2、数涨跌的三个指标(因素)分别为KJD.K,KLINE.5MA,MA。针对问题二,本文对上海股市指数的短期和中期分别做了预测。对于短期预测,本文选择灰色GM(1,1)模型和二次移动平均模型进行股市预测,以MATLAB工具实现基于灰色GM(1,1)模型和二次移动平均模型的股市预测,借助MATLAB实现对股市中收盘价的短期预测,并对两种模型进行分析比较,选取精确度相对较高的灰色GM(1,1)模型更为合适。中期预测,本文采用多元线性回归的方法来解决上海股票指数的中期预测问题。以各指标为自变量,收盘价为因变量,首先以SPSS为工具确立各指标间的相关性,分析结果显示,应剔除KJD.D因素。其次,由MATL
3、AB建立多元线性回归模型:收盘价=1987.3+0.45208*KJD.K+0.024867*KJD.J+1.8473e-009*VOL.VOL-0.0027366*MA-0.0026725*KLINE.5MA+0.00012421* SHORT.SHT+7.857e-005*LONG.LON。最后分析残差统计量,得出标准偏差为8.9255,在可接受范围内。针对问题三,采用三次样条函数插值方法进行短期预测,本文建立了函数插值模型,借助MATLAB对收盘价作三次样条函数插值预测,同时,与问题二中基于灰色GM(1,1)模型的股市预测得出的收盘价进行比较,得出三次样条函数插值模型的预测值比灰色GM(
4、1,1)模型的股市预测值整体平均偏高2.15%。关键词:主成分分析;灰色GM(1,1)模型;二次移动平均模型;多元线性回归分析;三次样条函数插值;一、问题重述1、背景沪(深)股市指数的涨跌与广大投资者的利益息息相关,其发展过程经历过大起大落,令投资者亦悲亦喜,退出难舍,进场恐惧。2、问题(1)请给出研判上海股市指数涨跌的三个指标(因素),并检验所给指标(因素)的有效性。(2)请给出上海股市指数的中短期预测。(3)应用三次样条函数插值给出上海股市指数的短期预测,并将其结果与上题得到的预测结果进行比较,指出其间的差异。二、问题分析股票市场作为社会经济的重要组成部分,对我国的经济发展发挥着重要的作用
5、深刻理解股票市场的运行规律,预测分析股票价格的未来走势,无论是对广大投资者的降低投资风险还是宏观经济管理部门的宏观调控,保障我国证券市场的健康持续发展,都有着十分重要的意义。针对问题一,上海股市指数涨跌的指标有很多,本文首先对钱龙股市分析软件确定影响股市指数涨跌的8个指标进行分析,考虑到各个指标对股市收盘价的影响及各指标之间的相互影响,因此,以各指标为自变量,收盘价为因变量,进行主成分分析。同时,在MATLAB中,利用plsregress(X,Y)进行交叉有效性检验,能够很好地对主成分分析过程中得到的三个主要指标进行有效性检验。针对问题二,上海股市指数的中短期预测需要将中期和短期预测分开讨论
6、对于短期预测,本文建立了两种模型,分别为灰色GM(1,1)模型和二次移动平均模型。本文通过对灰色模型的检验,得知其适合于股市的短期预测。同时,应用仅用于短期预测的二次移动平均模型与灰色GM(1,1)模型进行对比分析,得出较优方案。对于中期预测,本文采用多元线性回归模型进行分析预测,首先要对各指标的相关性分析,移除相关性过高的指标。之后进行残差统计量分析,观察标准偏差是否在可接受的范围内,验证标准差可接受后,借助MATLAB程序计算得出收盘价的线性回归模型。针对问题三,利用三次样条函数插值的方法,借助MATLAB对2015/05/01到2015/06/12间每天的收盘价作三次样条函数插值预测,
7、与问题二中基于灰色GM(1,1)模型的股市预测的收盘价进行比较,得出短期预测中较为精确的模型。三、问题假设1.股市的影响因素固定不变且影响效果不变;2.股市未来的行情由现在行情决定;3.所有数据均真实、可靠,具有处理价值;4.股票市场不会受到金融危机、政策等主观因素的影响。四、符号表示 均值 协方差矩阵 财务综合函数 灰色模型 光滑系数 截距 观测数据 残差SSR 回归平方和SSE 残差平方和五、模型的建立与求解众多的指标会影响股市收盘价,但其中有一部分指标对股价有绝对性的影响,通过主成分分析模型、灰色GM(1,1)模型、二次移动平均模型、多元线性回归模型和三次样条插值模型对上海股市主要影响指
8、标进行分析并对股市收盘价进行中短期预测。5.1 三个指标的确定主成分分析(Principal Component Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间相关性较弱,从而这些主成分能够反映始变量的绝大部分信息,且所含的信息互不重叠。5.1.1模型的建立假设用个变量来描述研究对象,分别用来表示,这个变量构成的维随机向量为。设随机向量X的均值为,协方差矩阵为。对X进行线性变化,考虑原始变量的线性组合:主成分是不相关的线性组合,并且是的线性组合中方差最大者,是与不相关的线性组合中方差最大者,是与Z1,都不相关
9、的线性组合中方差最大者。主成分分析法基本步骤第一步:设估计样本数为,选取的财务指标数为,则由估计样本的原始数据可得矩阵,其中表示第家上市公司的第项财务指标数据。第二步:为了消除各项财务指标之间在量纲化和数量级上的差别,对指标数据进行标准化,得到标准化矩阵(系统自动生成)。第三步:根据标准化数据矩阵建立协方差矩阵,是反映标准化后的数据之间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分析。其中,为原始变量与的相关系数。为实对称矩阵(即),只需计算其上三角元素或下三角元素即可,其计算公式为:第四步:根据协方差矩阵求出特征值、主成分贡献率和累计方差贡献率,确定主成分个数。解特征方程,
10、求出特征值。因为是正定矩阵,所以其特征值都为正数,将其按大小顺序排列,即。特征值是各主成分的方差,它的大小反映了各个主成分的影响力。主成分的贡献率Wi =,累计贡献率为。根据选取主成分个数的原则,特征值要求大于1且累计贡献率达80%-95%的特征值所对应的,其中整数m即为主成分的个数。第五步:建立初始因子载荷矩阵,解释主成分。因子载荷量是主成分与原始指标Xi的相关系数,揭示了主成分与各财务比率之间的相关程度,利用它可较好地解释主成分的经济意义。第六步:计算企业财务综合评分函数,计算出上市公司的综合值,并进行降序排列:5.1.2模型的求解表1 相关矩阵KJD.KKJD.JKJD.DVOL.VOL
11、MAKLINE.5MASHORT.SHTLONG.LON收盘价Sig.(单侧)KJD.K.000.000.030.422.496.020.320.257KJD.J.000.000.000.107.244.016.398.147KJD.D.000.000.239.309.332.047.297.383VOL.VOL.030.000.239.207.164.082.002.000MA.422.107.309.207.472.412.452.489KLINE.5MA.496.244.332.164.472.000.234.120SHORT.SHT.020.016.047.082.412.000.27
12、7.456LONG.LON.320.398.297.002.452.234.277.000收盘价.257.147.383.000.489.120.456.000由表1的相关矩阵得知,所研究的8项指标相互间的相关性较弱。表2 公因子方差初始提取KJD.K1.000.981KJD.J1.000.895KJD.D1.000.846VOL.VOL1.000.890MA1.000.945KLINE.5MA1.000.950SHORT.SHT1.000.117LONG.LON1.000.672提取方法:主成份分析。采用主成份分析方法进行提取,如表2所示,按照所占比例的大小顺序从大到小依次为KJD.K、KL
13、INE.5MA、MA、KJD.J、VOL.VOL、KJD.D、LONG.LON、SHORT.SHT。因此选取KJD.K,KLINE.5MA 和 MA 作为主要的影响因素,分别占到了所有影响因素的98.1%,95.0%,94.5%。表3 解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %13.24035.99735.9973.24035.99735.99722.46927.43363.4302.46927.43363.43031.47916.43479.8651.47916.43479.86541.12612.50892.3735.5395.99198.3636
14、089.98799.3517.052.57999.9308.006.070100.00092.354E-0082.616E-007100.000解释的总方差表显示了各主成分解释原始变量总方差的情况,spss默认保留特征根大于1的主成分,从上表中可以看到保留3个主成为为宜,这3个主成分集中了原始8个变量的79.865%,可见效果比较好。5.2 给定指标有效性的检验在MATLAB中,利用plsregress(X,Y)进行交叉有效性检验,如附录2所示,可知KJD.K,KLINE.5MA 和 MA具有有效性。5.3 短期预测灰色理论认为一切随机量都是在一定范围内、一定时间段上变化的灰色量及灰色过程。
15、数据处理不去寻找其统计规律和概率分布,而是对原始数据作一定处理后,使其成为有规律的时间序列数据,在此基础上建立灰色GM(1,1)模型。二次移动平均法,是对一次移动平均数再进行第二次移动平均,再以一次移动平均值和二次移动平均值为基础建立预测模型,计算预测值的方法。运用一次移动平均法求得的移动平均值,存在滞后偏差。特别是在时间序列数据呈现线性趋势时,移动平均值总是落后于观察值数据的变化。二次移动平均法,正是要纠正这一滞后偏差,建立预测目标的线性时间关系数学模型,求得预测值。二次移动平均预测法解决了预测值滞后于实际观察值的矛盾,适用于有明显趋势变动的市场现象时间序列的预测, 同时它还保留了一次移动平
16、均法的优点。二次移动平均法适用于时间序列,呈现线性趋势变化的预测。5.3.1 模型的建立(一)灰色GM(1,1)模型灰色GM(1,1)模型是指一阶,一个变量的微分方案预测模型,用于时间序列预测的离散形式的微分方程模型。而股市每日的收盘价是一个时间序列,因此可建立灰色GM(1,1)模型对上海股市2015/05/01-2015/06/12间每天的收盘价进行预测。将2015/05/01-2015/06/12间上海每天的股市收盘价看作序列(非负)为使其成为有规律的时间序列数据,利用MATLAB对作一次累加生成序列,记为 (1)其中,。令,利用MATLAB对进行准光滑检验和准指数规律检验,结果如下表。表
17、4 光滑检验结果表符号检验值0.490.330.250.190.160.140.121.110.100.090.080.080.070.070.640.060.050.050.050.040.040.040.040.040.040.030.030.030.03,故为准光滑序列,具有准指数规律。因此序列满足下列微分方程(称此方程为GM(1,1)的白化方程,也叫影子方程)由其确定的GM(1,1)模型的最小二乘估计参数列满足 (2)其中将所求得的与带入微分方程(2)。利用MATLAB(程序见附录3)求解灰色预测模型为:, (3)即,做累计还原,得到 的灰色预测模型为,即, (4)发展系数检验:根据发
18、展系数的范围进行模型的检验,发展系数的范围与对应的可预测性如表11所示。表5 发展系数的范围与其对应的可预测性可用于中长期预测可用于短期预测短期预测慎用用残差修正不宜使用灰色系统模型因为,故可用于短期预测。对所得结果进行后验差检验。设残差序列= 和 分别是残差的均值和方差, 和 分别为的均值和方差。后验差比值为,利用MATLAB(程序见附录3)求解后验差的范围与对应的可预测性的如表12所示。表6 后验差的范围与对应的可预测性指标评价c一级好0.35二级合格0.50三级勉强0.65四级不合格0.80由,故可用于短期预测。(二)二次移动平均模型二次移动平均值的公式其中,为第期的一次移动平均值;为第
19、期的二次移动平均值;为计算移动平均值的跨越期。 二次移动平均预测法的预测模型为:为向未来预测的期数;为截距,即第期现象的基础水平;为斜率,即第期现象单位时间的变化量。5.3.2 模型的求解(一)灰色GM(1,1)模型(二)二次移动平均模型图3 预测的股市收盘价走势由图2和图3比较得知,灰色GM(1,1)模型的预测精度更高,更可靠。5.4 中期预测一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 论文 上海 股市 指数 研判 分析 预测
