基于深度学习的股票价格预测研究.docx
《基于深度学习的股票价格预测研究.docx》由会员分享,可在线阅读,更多相关《基于深度学习的股票价格预测研究.docx(69页珍藏版)》请在三一文库上搜索。
1、第5章 模型的验证基于深度学习的股票价格预测研究 摘 要随着经济的发展,中国股票市场的规模持续扩大,早已成为金融投资的重要部分,掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此,人们不断探索着股票市场的变化规律,其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性,说明股票市场具有复杂的非线性特征。其次,结合股票市场特征对比了当前的预测方法,认为深度学习在股价预测中更具优势。接着,基于深度学习中的长短期记忆网络进行股价预测实验。通过对比试验,本文得出了长短期记忆网络在预测股价方面比三层全连接网
2、络更有实际意义的结论,同时发现了多日数据作为输入变量较单日数据更加准确,增加训练数据在一定程度上能提高准确率,且模型的预测准确率能达到68%。最后,本文重新选取了10支股票进行预测,以此进一步验证模型的效果。预测结果的平均准确率为62%,且能为绝大多数股票带来了正向效益,说明了模型具有适应性,进一步证明了深度学习在股价预测方面的意义。关键词:股价预测;人工神经网络;深度学习;长短期记忆网络AbstractWith the development of economy, the scale of Chinas stock market continues to expand, which has
3、 already become an important part of financial investment. It is of great significance for both regulators and investors to master the changing rules of the stock market.Firstly, this paper discusses the efficiency of Chinas stock market on the basis of efficient market hypothesis and fractal market
4、 hypothesis, which shows that the stock market has complex nonlinear characteristics. Secondly, combining with the characteristics of the stock market, this paper compares the current forecasting methods. Obviously deep learning has more advantages in stock price forecasting. Then, the stock price p
5、rediction experiment is carried out based on Long Short-term Memory Network (LSTM) in deep learning. The prediction results show that LSTM is more meaningful than the 3-layer fully connected network in predicting the stock price. The prediction accuracy of the model can reach 68%, and it has certain
6、 prediction ability. Finally, this paper selects 10 more stocks for prediction, with an average accuracy of 62%. The prediction of the model brings positive benefits to 9 stocks out of 10, which indicates that the model has applicability and further proves the significance of deep learning in stock
7、price prediction.Keywords: Stock Price Forecasting;ANN;Deep Learning;LSTM目 录摘 要IAbstractII目 录III第1章 绪 论11.1 课题背景及研究的目的和意义11.1.1课题背景11.1.2研究的目的和意义11.2国内外研究现状21.2.1中国股票市场有效性相关文献综述21.2.2神经网络相关文献综述31.2.3国内外研究现状评述61.3研究内容和方法71.3.1研究内容71.3.2研究方法7第2章 相关概念及理论介绍82.1股票市场相关理论82.1.1有效市场假说82.1.2分形市场假说92.2深度学习相关理
8、论102.2.1人工神经网络简介102.2.2循环神经网络简介122.2.3长短期记忆网络简介132.3本章小结14第3章 股价预测与深度学习163.1股价预测的方法163.1.1技术分析法163.1.2基本面分析法163.1.3统计分析法173.1.4非线性预测法173.2股票价格预测中的问题173.2.1股价数据的特征173.2.2预测方法比较183.3深度学习的兴起193.3.1深度学习的意义193.3.2长短期记忆网络的优势203.4深度学习的具体应用213.4.1数据挖掘213.4.2量化投资213.5本章小结22第4章 深度学习在股价预测中的实证研究234.1数据获取与处理234.
9、1.1数据获取234.1.2归一化处理234.2深度学习构建模型244.2.1实验设置244.2.2模型结构设计244.3模型评价方法264.3.1图表观察264.3.2统计误差264.3.3涨跌预测正确率与收益率274.4预测结果分析284.4.1单日输入预测实验284.4.实验评价334.4.3多日输入预测实验334.4.4实验评价384.5本章小结38第5章 模型的推广395.1股票选择395.2统计误差分析395.3涨跌预测正确率及收益率405.4综合评价415.5本章小结41结论42参考文献43致 谢45附 录 一46附 录 二47第1章 绪 论1.1 课题背景及研究的目的和意义1.
10、1.1课题背景中国的股票市场经历了三十多年的发展,已经走过了西方国家上百年的路程。随着经济的发展,中国股票市场的规模持续扩大。截至2019年底,中国沪深两市上市公司共3777家,总市值59.29万亿元,较2018年底增长了15.8万亿元,占全球总增长的12.3%。对企业而言,股票市场提供了直接融资的途径,一定程度上满足了企业的资金需求;对投资者而言,股票是投资理财的重要产品,拓宽了投资者的投资渠道;对整个国家而言,股票市场能积极调动社会的闲散资金,提高资源优化配置,推动经济的发展。我国证券市场不断壮大的同时,越来越多的计算机技术也被应用到探索和分析证券市场规律,深度学习就是其中之一。总的来说,
11、深度学习是机器学习领域的一个子集,是实现人工智能的一种重要方式。虽然深度学习的理念可以追溯到上个世纪六七十年代,但是直到近些年来才走进人们的视野,变得火爆起来。如今的时代,信息爆炸满足了深度学习需要的大量的数据,CPU、GPU和云计算的发展满足了深度学习需要的大量计算力,以及优秀算法大大缩短了训练周期,这些共同使得深度学习的实现变得越来越容易。世界上十大对冲基金中,其中八个都采用量化交易的方式,在这之中深度学习必不可少。1.1.2研究的目的和意义本文旨在将深度学习相关技术应用到金融数据的预测中,尝试建立能反映股票价格趋势的模型。我国的股票市场监管制度依然不够完善,不时出现股票的暴涨暴跌,这对国
12、家金融市场的发展是极为不利的。对于国家而言,股票市场是国民经济的晴雨表,可以通过探索股票市场的变化规律对未来经济有合理的预期,从而及时做出相应的政策,稳定经济的发展;对监管机构而言,掌握股票市场的变化规律能一定程度上为监管者提供决策依据,完善金融市场体制;对投资者而言,需要探索股票市场的规律来规避投资风险,获得收益。自从股票市场诞生以来,人们以各种方式探索和研究着其变化规律,并取得了许多研究成果。预测股票市场的变化十分困难,因为股票市场是一个非常复杂的非线性非平稳系统,受很多因素的印象。在传统的预测模型中大多都是采用线性模型拟合股价,如自回归模型、移动平均模型等,但很难适应股票市场的变化。深度
13、学习是机器学习中一个新兴的领域,建立在模拟人脑分析学习的神经网络的基础上,具有学习能力强、非线性映射能力强、适应性好等优点,有着广泛的应用,如自言语言处理、图像识别等领域。深度学习有五种常见的网络,分别是:循环神经网络(RNN)、卷积神经网络(CNN)、生成对抗网络(GAN)、深度信念网络(DBN)、深度强化学习(DRL)。本文将使用一种特殊的循环神经网络长短期记忆网络(LSTM)进行股价预测的研究,并将以近期实际数据进行预测模拟。1.2国内外研究现状1.2.1中国股票市场有效性相关文献综述1.2.1.1有效市场假说根据1970年Eugene Fama提出的有效市场假说,市场可以根据有效性分成
14、三种情况:弱势有效假说(Weak Efficient Hypothesis)、半强势有效假说(Semi-strong Efficient Hypothesis)、强势有效假说(Strong Efficient Hypothesis)。对于强势有效市场,其条件过于苛刻,目前的研究均认为没有市场能够达到强势有效;对于半强势有效的检验,大多数学者结论一致,都认为我国股票市场没有达到半强势有效;对于我国股票市场是否满足弱势有效的问题有比较大争议,学者们分成两派:一是认为中国股票市场依然没有达到弱势有效。孟婷等人(2012)采用自回归条件异方差和Hurst指数两种方法对上海证券市场和深圳证券市场进行检验
15、结果表明中国证券市场未达到弱势有效1。徐悦(2016)首先定性分析了股票市场存在的问题,然后使用游程检验定量分析,认为我国证券市场未达到弱势有效2。张智(2018)采用了单根检验的方法对深圳交易所创业板的证券价格进行检验,得出了创业板日指数未达到随机游走状态的结论,其结果表明创业板市场依然未达到弱势有效3。二是认为中国股票市场已经达到弱势有效。赵浩东(2016)使用单根检验的方法对上证指数进行研究,认为我国股票市场已经达到了弱势有效4。王丽(2017)对上证综合指数进行了自相关检验和单根检验,结果表明上证综合指数符合随机游走过程5。廖宜静和吴瑜琪(2017)检验序列自相关对上海证券交易市场进
16、行研究,结果表明上海证券交易市场已达到弱势有效6。朱瑞(2018)对沪深两市300指数进行游程检验,结果表明我国沪深两市股票市场已达到弱势有效7。1.2.1.2分型市场假说分型市场假说(Fractal Market Hypothesis)是基于有效市场假说发展而来的,其主要建立在非线性系统上,解释了很多有效市场假说无法解释的现象。分型市场假说的市场特征是非线性的开放系统,允许非均衡情况存在,较于有效市场假说条件更宽松,更符合现实情况。关于我国股票市场分型特征的研究,几乎每一位学者都采用了R/S重标极差和Hurst指数进行研究。朱品品和王绍锋(2017)使用上述方法研究了中国创业板股票市场分形特
17、征,秦喜文等人(2016)研究的是沪深300指数的分形特征,孙影(2016)则是深交所上市股票的分形特征,结论都为中国股票市场具有分型特征8 9 10。1.2.2神经网络相关文献综述1.2.2.1浅层网络的应用在机器学习领域,G. Cybenko(1989)证明了有一个著名的万能近似定理(universal approximation theorem)。该定理的主要内容为:在理论上,一个三层前馈神经网络可以拟合任意复杂的连续函数11。一般情况下,神经网络都会包括一个输入层和一个输出层,即三层的神经网络仅包含一个隐含层。通过万能近似定理可以得知,三层的神经网络就已经拥有强大的功能,也正是因为如此
18、三层的网络普遍应用于各个领域。早在上世纪九十年代就有学者采用机器学习的方法来预测股票价格。H. White(1988)使用神经网络预测IBM公司的股票回报率,但最终预测的准确度不高,他认为这是神经网络在训练中陷入了局部极值所导致的12。如今,神经网络得到了长足的发展,已经是股票价格预测的重要方法。国内外的研究集中于实证方面,且研究模型大多采用的是三层的前馈式神经网络。Jinke Li(2019)建立了BP(back propagation)神经网络模型对浦发银行(股票代码600000)和华鑫股份(股票代码600621)两支股票的收盘价进行了预测。结果表明,三层BP神经网络能有效地对股票收盘价
19、进行预测,辅助投资决策是可行的13。同样是建立三层BP神经网络,Wanle Chi(2019)收集了238个工作日的交易信息,对上证指数进行了预测,取得了不错的预测效果14。褚文华(2019)运用了三层BP神经网络对股票数据进行了预测,但最终预测的效果并不好。他认为这是由于选取的样本数量较少所导致的15。黄秋萍等人(2015)建立了三个模型对上证指数进行预测,分别使用了支持向量机(SVM)、BP神经网络和小波神经网络,对比了三个模型的预测效果,结果表明单独使用这三种模型都不能在股票投资中获得稳定的收益16。针对传统神经网络的缺陷,很多学者采用了和其他模型相结合的方法进行改进来提高精度。为了解决
20、神经网络容易陷入局部极值的问题,不少学者进行了研究。Arnold F.Shapiro(2002)创新地结合了多个算法,使用遗传算法(GA)对神经网络进行优化,形成了一个复合式的预测模型,他对每种技术的优缺点及性质进行了讨论17。但是没与具体的应用,也没有与单个网络进行对比。Zhang Yudong和Wu Lenan(2008)使用改进的细菌趋化性优化(IBCO)方法改进神经网络,建立了一种有效的股票指数预测模型18。Feng Li(2009)等人提出了基于利用Levenberg-Marquardt算法对神经网络法进行改进,并进行了股票价格的预测,有效的避免了局部极值,取得了不错的短期预测成果1
21、9。黄宏运等人(2017)使用了遗传算法改进后的BP神经网络模型进行股票指数预测,收敛速度明显加快,预测性也得到了提高20。谢梦蝶和秦江涛(2019)使用遗传算法优化了BP网络的初始权值和阈值,构造出了准确率更高,收敛速度更快的模型21。邓烜堃等人(2018)对输入数据进行了主成分分析降维以及归一化的预处理,使用带动量项的BP学习算法进行训练,较传统方法精度更高22。罗成(2019)对输入数据的降维处理采用了奇异值分解法(SVD),这样降维后再使用神经网络进行训练,最终取得了较好的成果23。胡玲燕和朱家明(2019)结合了逐步回归和BP神经网络构建了模型,在股价的短期预测中取得了一定成果24。
22、1.2.2.2深度学习相关文献综述深度学习是机器学习中使用深度神经网络的子领域,不可避免的会使用深度神经网络。浅层神经网络通常只包含一个或两个隐含层,而深度神经网络则会包含更多的隐含层。特别是在时间序列问题中,多数学者采用了循环神经网络(RNN)或长短期记忆网络(LSTM)来实现。Xiong等人(2015)构建LSTM神经网络预测了标准普尔500指数的波动率,证明了通过深度学习和神经网络模型可以更好地预测股票市场的行为25。Onchar等人(2017)使用人工神经网络来预测股票指数,使用了多层感知器(MLP)、卷积神经网络(CNN)和长短时记忆(LSTM)递归神经网络,三种网络的准确率相近并且
23、均在60%以上26。Jiang Q等人(2018)以上证综合指数和道琼斯指数的每日数据为研究对象,分别使用RNN和LSTM来构建模型,比较了LSTM和RNN两种网络在预测时间序列问题上的优缺点。对比后发现,LSTM可以很好地用于股票价格预测27。邓凤欣与王洪良(2018)使用长短期记忆网络(LSTM)对微软、亚马逊等个股进行了预测,证明了该模型在预测个股价格趋势中有较高的精度28。乔若羽(2019)建立了包括卷积神经网络(CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等神经网络模型进行对照,充分研究了不同变量对于不同网络性能的影响29。宋刚等人(2019)使用粒子群算法对长短期记
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 股票价格 预测 研究
