欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PDF文档下载
     

    算法交易:制胜策略与原理.html.pdf

    • 资源ID:5518748       资源大小:19.16MB        全文页数:140页
    • 资源格式: PDF        下载积分:10
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要10
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    算法交易:制胜策略与原理.html.pdf

    前言 本书所涉及的是一个适用于散户和机构交易者的、实用型的交易算法及相关策略,但它并不是一个在金融理论方面的学术专著。相反,我希望 可以告诉读者的是:我是将一些在过去几十年里最有用的金融研究、见解与相应的思考相结合,而且,实际利用这些理论进行现实的交易工 作。 因为在本书当中,交易策略处于一个中心的位置,所以,我们将广泛地涵盖这些交易策略,它们大致可分为:均值回归系列和动量系列。我们 将为每一类策略所相关的交易制定相应的技术标准,而同样重要的是,我们要探寻交易策略运行的基本原理。同时,所有研究的重点是简易型 的以及线性的交易策略。但是,过度拟合的矫正方法以及数据探测过程当中所生成的偏差,常常会困扰这些具有复杂特质的交易策略。 在均值回归交易策略所相关的系列当中,我们将讨论以多元的统计技术如扩展版的迪基-富勒检验(Dickey-Fuller检验,即ADF检验)、 赫斯特(Hurst)指数、方差比检验、半衰期检验模式等来检测时间序列的均值回归之属性,以及相关的平稳性;同时,我们还要检测一个 由金融工具所构建的投资组合之协整属性相关检测模式包括协整型ADF检验(即CADF检验)、约翰森(Johansen)检验等。除了前述这 些统计测试模式被机械地应用于时间序列而外,我们还要努力传达一个直观的理解方法,即要认知相关测试的真正用意以及简易数学方程背后 的深层含义。 我们将解析一些具有均值回归属性之投资组合所相关的最简单的技术和策略模式如线性交易模式、布林带线、卡尔曼过滤法则(Kalman filter)等。另外,我们还要解析在向相关的测试模型和交易策略模型输入相应数据之时,我们应该输入原价,还是价格对数,抑或是价 格比率到底哪种形式是最有效的,特别是我们还要说明:多用途的,且与多种交易策略相关的卡尔曼过滤法则对交易者而言,是不是有效 的。在本书当中,时间序列与横截面式的(即横向的)均值回归之交易策略的区别将被讨论。我们将探讨在均值回归交易策略之中,尤其是在 处理点差的时候,“缩放技术”和突出错误数据之风险的做法到底有哪些优势与劣势。 均值回归交易策略的案例来自日间和盘中的股票交易模式、交易所交易基金(ETF基金)之间的配对交易和多重交易、ETF基金与成分股票之 间的交易、货币之配对交易、期货之跨期与跨市场的套利交易。我们将解释最近几年,由于黑池交易和高频交易的兴起,使得前述这些交易策 略在实际的操作过程中面临很大的挑战;我们还将说明某些基本面的要素是如何能够应对一个目前非常有利可图的ETF基金之配对交易所出现 的、暂时性的背离情境;同时,我们要说明如何应用同样的要素构建一种改进型的交易策略。在讨论货币交易时,我们很小心地对相关问题进 行了相应解析,即我们要解释为什么其收益率的计算方法相对于股票交易商而言,似乎很陌生,而且,在相应的概念当中,诸如循环收益率之 类的问题有时可能是非常重要的。我们特别强调要致力于研究:现货收益率与连续循环收益率之间的关系,以及一些从期货价格相关的简易数 学模型之中衍生的期货交易策略。本书当中,我们还以图示以及数学的表现形式探讨了现货溢价和期货溢价的概念。另外,相应之章节将介绍 货币工具之均值回归的属性,并且,引入期货之中一个非常特殊的形式波动率期货(即VX期货),同时,解析其形成有利可图之交易策略 的基本过程。 在动量交易策略所相关的系列之中,我们首先分析了一些关于时间序列型动量模式的统计检验方法,其中,最为重要的主题是探索股票和期货 动量运行模式之四个驱动因子,并且,为从时间序列型和横向型动量运行模式之中提取相应收益而贡献相关的策略。期货的连续循环收益是动 量模式的一个驱动因子,但事实证明:在许多不同的情况之下,被迫减价出售资产和回购模式是股票与ETF基金之动量运行模式的主要驱动因 子。同时,基于新闻事件、对信息的敏感度、杠杆式ETF基金、订单流量以及高频交易等因素,一些较新型的动量型交易策略被开发出来。最 后,我们将探讨动量型交易策略与均值回归型交易策略之利弊,进而在近期金融史上,且于不同的市场机制之下,去发现那些具有完全不同特 质的风险收益。 我一直认为:在发表的刊物之中,在许多书籍、杂志和博客当中,我们会很容易地找到所谓的盈利型交易策略,但是,如果要探究相应策略为 什么存在缺陷,那就非常困难了,这也许是最终注定的。所以,尽管强调了原型策略的重要性,我们还是要讨论相应算法与交易策略中所常见 的缺陷,这在使相关读者深入理解交易策略之本来面目方面,是最有价值的,而且从相应的回测程序来看,前述的这些缺陷会导致实时交易的 结果与回测的绩效之间存在很大的差异。即使是精通交易算法的专业人士也会同意这样一种说法,那就是:相同的理论策略既可导致可观的盈 利,也会造成糟糕的损失,这取决于策略实施的细节。因此,在本书当中,我会着重检验相应交易策略的回测效果和实施效果;同时,我还要 解析如下概念,即数据探测过程中所产生的偏差、与企业退市相关联的相应股票之生存偏差问题、初级市场与综合市场的报价问题、货币报价 的地区依赖性、卖空限制所引发的细微差别、连续期货合约的构建问题,以及期货之收盘价格与结算价格的回测问题。另外,我们也突出了一 些情况,即在相应的历史事件当中,一旦“策略属性”发生变更,即使是最正确的回测系统也无法预测此策略的未来收益。 我还注意到:我们需要选择合适的软件平台来进行相应之回测和自动化的运行工作,而既定的MATLAB软件(其中,有我最喜欢的编程语言) 也不再是本书的唯一选项;我们还需要根据科学技术的发展现状,对相应编程技巧的每一个层次和许多不同的预算功能,进行相关的调查;特 别是,我们已经注意到交易者的“集成开发环境”可以从具有工业实力的平台(如Deltix平台)到无数开放式的源代码版本(如Tradelink 版本)进行依次排列。就像我们解释的那样:从回测系统到现实交易的切换模式是评估相应平台最重要的标准在这种情况下,时下较热 的“复杂事件处理”之概念也将被引入本书所设置的情境之中。 在之前的一本书中,我探讨了风险和资金管理的问题,该书建立在凯利公式(Kelly formula)之上确定最优化的杠杆比例以及平衡收益 与风险的资本配置。在这里,我再次提及风险和资金管理,且仍然是基于凯利公式。但于本书当中,我结合了经过历练的风险管理之实际经验 进行分析,其中包括:所谓的“黑天鹅事件”(Black Swan)、投资组合之风险比例固化模式以及止损机制美国联邦最高法院的法官罗伯特 ·杰克逊(Robert H.Jackson)已经阐述过凯利公式的应用,他说:“我们要利用一点实践的智慧来调和其纯理性的逻辑。”。而我们特别 关注的情况是:在现实的条件下,当我们不能设定收益率之高斯分布的模式之时,我们需要如何找到最佳的杠杆比例。此外,我们认为,“风 险指标体系”可能是全面风险管理计划中一个有用的组成部分。蒙特卡罗模拟法的应用是我先前忽略了的一个普通技术。在这里,我们将演 示:根据模拟的数据而不是历史的数据来测试回测系统的统计意义,同时,评估某一特定交易策略所相关的概率分布之尾部风险。 本书是我之前所写的量化交易之后续文本。在那本书中,我专注于交易算法的基本技巧,例如如何确定新型交易策略之思路,如何回测一 个交易策略,如何对自动化执行系统进行基本的考量,最后,通过凯利公式得出风险的管理模式。但是,一些有用的典型策略被一定程度地忽 略了,但这些不是重点,如果你对交易算法完全陌生,那么,量化交易则是一本好书,本书则完全是关乎交易策略的。 本书中的所有案例都是用MATLAB之程序代码而构建的,它们都可以从网站www.epchan.com/book2,或者我的网 站www.wiley.com/go/algotrading进行下载,而且,读者会发现,相应的账户密码被嵌入在第一个例证当中。不熟悉MATLAB的读者可能 要研究量化交易的教程,或在平台mathworks.com之上参看免费的研讨会。此外,MATLAB的统计工具箱也偶尔被使用(所有MATLAB产品都 可以在并行计算工具箱MathWorks之上进行免费试用)。 软件和数学是交易算法的两种语言。读者会发现:相较于我之前的一本书而言,本书涉及更多的数学知识。这是因为我希望在讨论金融市场的 概念时,可以注入更多的精度;还有一个原因是我相信用简单的数学模型比通常使用的数据挖掘方法更加具有优势;也就是说,我们不是把许 多技术指标或规则放在一个价格系列之中,并观察哪个指标或规则更加有利可图。如此,在数据探测的过程中,容易出现相应的偏差,而我们 所试图实现的是凭借一个简单的数学模型去提取一个价格系列的基本属性,同时利用这个模型来计算我们的财务收益。然而,在股票、期货和 货币交易中,其所需的数学水平要远低于衍生品交易中所需的高度,任何掌握初级微积分、线性代数和统计的人士都能够在此基础上进行讨论 而毫无障碍。如果你发现方程太混乱,那你可以直接去参看相应的案例,并参看其具体操作的软件代码。 虽然在机构型投资管理行业工作多年,但在写第一本书的时候,我还是一个独立的交易者。在随后的几年里,我已经开始管理两个对冲基金。 有时我与一个合作伙伴共同工作,有时我自己单独操作。我在2007年夏的“量子基金”崩溃之时得以幸免,并且在2008年金融危机、2010年金 融市场闪电崩盘、2011年美国联邦债务评级下调以及20112012年欧洲债务危机之中,我都能够存活下来,因此,我比以前更有信心。我可 以认定:尽管我确实在过渡期间学到更多的金融知识,然而,初始开发的交易算法是合理的。例如,我发现无论市场预期多么险恶,亲手推翻 某个模型始终都不是一个好主意;同时,保守的交易模式始终比过度放债要好,尤其是在管理他人资产的时候;还有,交易策略的表现形式往 往具有均值回归的特质;另外,我们的过度自信对相关交易策略而言是最大的危险;最后,在运行错误交易模式和接近灾难的时候,一个人所 得到的教训较之于从成功交易所获取的经验而言,更加值得珍惜,而我就是想在本书当中,记录过去四年以来的诸多经验教训。 我的基金管理经验并没有改变本书中的重点,即本书之要旨是为散户型交易者服务。如果具备足够的决心且进行一些修改和完善,所有的策略 都可以由一个独立的交易者来实现,此种类型的交易者不需要在券商所在公司开立一个七位数的账户,也不需要五位数字的技术成本。我给这 些交易者的信息仍然是一样的,即一个资源有限和计算能力不强的人仍然可以按照其自定的游戏规则去挑战强大的行业内部人员。 写作动机 著书的交易人士需要回答其他交易者一个基本的问题:为什么他们会写这样一本书呢?更具体地说,如果所描述的交易策略是正确的,那么, 为什么相关交易者会宣传这些策略呢?而这种做法肯定会减少相关策略应用方的未来收益。 我首先回答第二个问题。我所描述的诸多策略对于专业交易者来说是相当熟悉的,所以我对它们如数家珍;其他有如此高能力的交易者在另外 一些人运行这些策略的时候,其盈利能力不会受到严重影响。但是,也有一些交易策略具有相反的特质:它们的盈利能力较低,或者,有其他 的局限性以至于没有吸引力,而且,我不再认为此类策略适用于我自己所构建的基金式的投资组合,但是,它们仍可以胜任个体交易者的账 户。最后,对于我经常描述的策略而言:其在第一眼看上去是非常有前途的,但是,可能包含各种缺陷,对此,我没有进行充分的研究和精 化,例如:在我的例证当中,相应测试代码就没有包含相关的交易成本,而这一点恰恰是回测系统当中一个有意义的关键值;还有,我经常使 用样本内数据以优化参数、测试性能,如此,则肯定会导致回测的结果不准。在例证当中,所有前述这些缺陷都会使我犯错,因此,简化的版 本则更具说明性和可读性,这些版本可以被称为“原型策略”,它们并不用于交易之中,但以其阐述常见的交易算法与技术是有用的;同时, 它们也可以为读者进一步完善和改进其自身的交易水平提供可用的思路。 那么,我们的基本动机是什么呢?它是这样的:在收集信息方面,大众的知识往往比其他任何方法都有效,因此,本书当中所讨论的策略以及 我的第一本书都非常期待广大读者的反馈意见。 资料来源及致谢 本书所选用的大部分素材都不是我发明的。除了传统的、常用的资料如书籍、学术期刊、杂志、博客、在线交易论坛(可以从平台 elitetrader.com与nuclearphynance.com处获取)之外,现在还出现了一种新型的在线专家网络,如平台hightable.com和平台 quora.com某些具体问题可以被“发帖”,然后,由真正的行业专家来做出回答。我个人就曾受益于这些资源,并且,我由衷地感谢各位在 线的专家,他们可以从意想不到的深度和细节来回答我的问题。 在我之前的著作和博客(http:/epchan.blogspot.com)里面,我有幸从许多有见地的读者那里收到大量的反馈信息,而这些人的意见都 被充实到我的知识库当中。 在许多机构分析师和交易员出席的新加坡和伦敦的定期研讨会中,就交易算法与规则的各种主题,我曾进行过相应的讲解与授课。与会人士给 我提供了非常有价值的见解,而这些见解可能不会轻易地出现在任何公共论坛之上;同时,在加拿大、中国内地、中国香港、印度、南非和美 国的针对客户端的研讨会之上,相应的主题也为我提供了广阔的国际视野,而且也增强了其自身的被关注度。 即使是作为一个独立的交易者和基金经理,我也很荣幸地与许多具有专业知识的金融人士进行合作,其中的一些合作是短期的和非正式的,而 其他合作则推动了基金管理公司的正式成型;特别是,我要感谢史蒂夫·哈尔佩恩和罗杰·亨特,我和他们曾经进行过广泛的讨论,并且共同 策划过无数的合作项目。 我很感激布莱恩·唐宁,他为我介绍了一些在第1章中所提到的交易技术;同时,我还要感谢罗斯里奥·英格吉拉,他向我展示了他的外汇交易 平台(FXOne)。 最后,非常感谢我的编辑比尔·法隆和John&Wiley出版社的各位同仁,他们一直都非常热心地支持我书中的想法;同时,还要感谢策划编辑 梅格·弗里伯恩,她的建议绝对是有价值的,并且,我要感谢编辑史蒂文·基里兹,他指导完成了本书的最终格式。 第1章 回测及自动化的执行系统 本书的重点在于研究交易策略的特殊类别,而不是纠缠于普通的回测技术。相对于各种交易策略来说,其中存在着大量需要 注意的关键事项以及具有普遍性的缺陷及圈套。对于此,我们应该给予其优先的考量。如果我们不采取措施规避某些交易策略中 的缺陷与圈套,而是毫无顾忌地应用此种交易策略,同时对其进行相应的回测,那么,这种回测将毫无意义,而且也可能出现更 加糟糕的情况,因为在错误的背景之下所进行的回测会对你产生误导,从而诱发巨大的亏损。 回测技术的主要特色是:对预期收益进行估算,同时,对相应交易策略的绩效进行统计学意义上的权衡。因此,我们有理由 对相关的评估数据提出质疑。我们将运用假设检验以及蒙特卡罗模拟等方法对相应预期绩效的统计数据进行全方位、多层次的探 讨。一般而言,在对相关特定交易策略进行回测的过程中,相应的交易次数越多,由此而衍生的绩效表现就越好。然而,即使某 个特定的回测系统能够完美地运行,也能够规避相应的陷阱,那也不意味着未来的收益是可预期的情境的瞬时变化会使所 有的预期失效,而在金融交易的历史进程中,确实存在一些相关的典型案例。 在回测过程当中,如何选取相应的软件平台也是一个非常重要的因素,需要我们进行优先的考量。一个好的平台不仅仅是高 效能的,它应该是针对最为广泛的交易类别,尽最大可能地覆盖到相应交易策略的各个领域;同时,相关平台还应该减少乃至消 除前述的、相应交易策略中所潜在的圈套与陷阱。接下来,我们需要进行一下相应的解析,即为什么一个良好的回测平台需要与 一个完美的自动运行的机制相结合,也就是说,一个最优秀的平台往往需要具备两项功能。 1.1 回测的重要性 所谓回测就是一个根据相关的交易策略填充相应历史数据的过程,其目的就是检验相应策略的运行情况,而作为交易者的我 们则希望相应的历史数据为我们自身指明方向,对未来进行预期。因此,这个特定的回测过程的重要性则是不言而喻的,即你以 白手起家般的方式开发出一款交易策略,那你当然想了解它的效能了!但是,即便是你从报纸杂志等刊物上解读的某个交易策 略,而且你也确信相关的开发者没有对此策略的效能进行夸张去欺骗交易者,你自己仍然需要对此策略进行独立的回测,而且这 个过程是必不可少的,这里有以下几个原因。 在通常情况下,某种特定的交易策略之盈利能力对某些相关的运行细节非常敏感,比如,股票的订单是在开盘时植入,还是 在开盘之后瞬时植入?迷你口座的标准普尔500指数的订单是在股票市场收盘的下午4点之前植入,还是在期货市场收盘时段的 下午4:15植入?如果我们想敲入买入价或卖出价而触发一笔交易,那么,我们所选定的价格是最新的价格吗?前述的所有这些 细节问题在发表的文献当中一般都是免谈的,相关作者为强化文章的主旨而将其搁置,但是,恰恰是这些细节问题影响了某些特 定的、正在运行的交易策略之盈利能力。为了对相应的细节问题进行完善的甄别,进而在我们自己的自动化运行系统当中使相应 细节发挥效用,唯一可行的路径就是:我们自己要对相关的特定交易策略进行回测,而比较理想的状态是只要敲一下键盘 上的按钮,我们的回测系统就会切换到自动化的运行程序之中,从而确保相关的细节发挥效用。 一旦如上述的回测程序那样,我们运行了某项特定交易策略的每一个环节,那么,我们就可以从微观的角度对相关的细节进 行观察,进而分析回测系统,或相应交易策略中所存在的漏洞,例如,在我们对某种股票投资组合之交易策略以多头与空头的情 境进行双向的回测检验时,我们需要了解一个实际情况,即相对于比较合理的交易规模,某些股票很难买进,而且也不易沽出 对此种情况我们考虑了吗?还有,在对相应期货市场中的跨市撮合交易之策略进行回测的过程中,我们能够确保两个市场 于同一时段收盘吗?我们能够以同一个收盘价格成交吗?将相应交易策略的各种缺陷与漏洞一个一个罗列出来会使读者感到乏 味,不过,我在这里还是要对一些具有普遍性的问题进行重点的说明,相关内容将在1.2节体现出来。在通常情况下,每一种金 融产品、每一项交易策略都有其自身的、特殊的缺陷与漏洞,而因之形成的误区会使某种交易策略在回测系统中的表现较之以往 的实际运行情况要优秀得多这是特别危险的! 即使我们对自身的交易头寸比较满意,同时在相应的回测程序当中已经对相应策略的所有细节进行了解读与运行,也没有发 现什么漏洞,但我们还是要对那些已经成熟的交易策略进行回测检验这是至关重要的。 对业已开发的比较成熟的交易策略进行回测检验的过程当中,你应该在此种策略发表之后的一定时间序列当中以样本外的数 据进行测试。如果植入样本外的数据之后,相关交易策略的表现平平,那就说明相关的交易策略只能在有限的数据集合之下运 行,这实际上比人们的普遍认知水平更加重要。很多交易策略的开发者在他们的文章中抱怨,不理想的回测结果是因为进行 了“样本外数据验证”而造成的,但实际上,如果样本外数据检测的结果不够理想,作者就会相应调整一些参数,对相关模型进 行大幅度的“加减”,从而使相关的交易策略变得无懈可击。因此,真正的“样本外数据检验”不能在某种策略发表且“坐 实”之后才开始。 最后一点,通过我们自己对相应的交易策略进行回测,我们可以经常性地对其进行修正与改进,从而使其具有较高概率的收 益性、较低概率的风险性。而交易过程中的回测程序需要遵循“科学的原理”我们应该设定一个套利的前提假设,而此种 假设可以来自我们自己对某种金融产品关联市场的直觉经验,也可以取材于业已发表的某项研究成果;接下来,我们需要在回测 过程中对相应的假设前提进行“证实”或“证伪”;如果相应的回测结果不那么令人满意,我们可以修正之前所做的假设检验, 然后重复前述的过程。 正如我前面所强调的那样:一种交易策略的成功与否取决于相应的细节,一个微妙的细节变化可以使相关策略的运行取得实 质性的进展,而我们所进行的相应变动之过程并不复杂,就像改变移动均线的回测时间序列,或以开盘价植入订单的方式取代以 收盘价成交的方式那样简单。总之,对相关交易策略的回测模式要求我们对每一个细节问题都要进行认真的检测。 1.2 回测过程中普遍存在的误区 在对每一个交易策略进行回测的过程中,针对某一个特定的问题,我们可以允许相应的策略出现一些误差,但是,对其中一 些具有普遍性的问题,我们就不能等闲视之了,这些问题与缺陷有的是各类金融工具所共有的,有些是某些特定的金融产品所独 具的。 1.前视偏差 如标题所蕴含的意义那样,所谓“前视偏差”是指:相关的回测系统以未来的价格决定当前的交易信号,或者说,以未来的 信息为当前的时刻进行相应的预期。比较普遍的做法是:相应的回测系统以一日间的价格之高点和低点作为当天入市的交易信号 (但是,在一个交易日结束之前,我们是无法预料当天的最高价位和最低价位的)。前述的这种“前视偏差效应”是一项根本性 的程序缺陷,它只能影响理论上的回测系统,但是对实时的交易程序不起任何作用,因为没有哪个实时交易系统能够获得未来的 信息。然而,正是因为回测程序与实时交易系统存在前述的这种差异,我们由此就可以找到规避“前视偏差”的方法;如果回测 程序与实时交易程序的检测结果相同,那么,两个程序之唯一的差异则源自你向相应系统所填充的数据(比如,你向回测系统填 充的是历史数据,而向实时交易系统填充的是即时的行情数据),通过寻找“差异”的方法,我们就可以消除回测程序之中 的“前视偏差效应”。在本章接下来的论述当中,我们可以去试着发现一些平台,于其上,我们将采集一些对回测系统与实时交 易系统都适用的、相同的源代码。 2.数据探测法的偏差与完美线性相关问题的解析 数据探测法之所以存在偏差是由于有太多的自由参数附着于完美条件下的随机市场模型之中,从而使相关系统和程序之过往 的历史性能看起来不错。然而,随机的行情变幻模式在未来是不可知的,所以向相应的模型填充相应参数的做法并没有多少“预 测”的功能。 实际上,纠正上述“偏差”的方法并不神秘:我们可以通过样本外的数据来检测相关的模型对于那些不能通过检验的 模型,我们可以弃之不用;不过,任何事情说起来容易,做起来很难:难道我们真的愿意放弃可能是付出几个星期的辛勤劳动而 构建的模型,并将其“弃如敝屣”吗?我认为只有少数人可以;大多数人倾向于对相关的模型以这样或那样的方式进行修正,从 而使其在样本内与样本外的数据检测当中均表现良好,但一旦这样做,那后果就是:我们因此会将样本外的数据转换成样本内的 数据。 如果你不愿意因为某些特定的模型在样本外数据的框架之下表现平平而舍弃之(可能的原因是:相关模型在运行样本外数据 时,由于运气不佳而表现不好),或者说,你在构建模型之时所采集的数据过少,从而真的需要运用最广泛的数据来修正相关的 模型,那么,你可以考虑采用交叉验证的方法,也就是说,你可以选择大量的不同类型的数据子集来检测和修正相关的模型,进 而确保相关的模型在不同数据子集的架构之下良好地运行。而我们之所以倾向于在短期最大跌幅区间构建附着高夏普比率之模型 的原因是:此种方法能够以最大程度的自动化模式确保相关的模型通过交叉式的检测,而那些不能通过检测的模型所对应的数据 子集大都是在下调区间之内缺少相应的样本。 事实上,有一种交易策略的构建方法可以使数据探测过程中所出现的偏差最小化,即尽可能地简化相应模型的构建过程,同 时,参数的选择也是越少越好。很多交易者喜欢将简单的问题复杂化,自行制定很多烦琐的交易规则,但是他们没有意识到:一 个应用较少参数的模型一旦被赋予较复杂的交易规则,那它在数据探测的过程中则极易受到相关误差的影响,由此,我们可以得 出结论:非线性模型比线性模型更加容易受到相应误差的干扰,因为非线性模型不仅仅是其构建过程过于烦琐,而且它所采集的 随机参数也比线性模型多。如果我们企图以简单的金融工具历史价格的外推法来预期其未来的走势,一个非线性的模型可以更好 地填充数据,但它不能做出较好的预期,但是,如果我们向非线性模型与线性模型同样填充大量的参数,相对于非线性模型,我 们经常采用微积分的方法,以泰勒连续展开公式求得近似的值,这就意味着:相对于每一个非线性模型,总会有一个相应比较简 单的、近似的、线性的解;而我们也不得不承认一个现实,即线性模型的本身是不被采用的(这里也存在一种例外,即在单一事 件下弱化某些低阶项,但我们很少用此类事件描述理想金融市场的时间序列)。 还有一个与上下文等价的问题是:我们应该以何种概率分布形式来预期相应的收益呢?我们经常听到一些议论,即所谓的高 斯分布理论无法捕捉金融市场的极端事件,但是,抛却高斯分布理论不讲,我们将面临很多概率分布理论的选择问题如果 选择学生t分布理论1,它能够捕捉收益率曲线的斜率与峰值,那就有用吗?如果选择帕累托分布理论,那它所覆盖的有限二阶 矩模型中所有的概率分布就一定有效吗?坦白地讲,我们所做出的任何一项选择都具有主观性,在数量有限的数据观测的情境下 所得出的结论也是不完善的。因此,根据奥卡姆的剃刀定律,除非有强大的理论与实证的支撑,那些基于非高斯分布理论所形成 的概率分布模式将不被采信,高斯的概率分布模式仍然有效。 线性模型不仅意味着线性价格的预期公式,同时也蕴含了资本的配置方式。现在我们考虑一下:在价格序列之均值回归的模 型项下在接下来的时间序列dt的区间内,相应价格的变动值为dy,且dy与均值和当前价格之差成正比,即 dy(t)=y(t-1)+dt+d,此方程被称为“乌伦贝克随机微积分方程”,在第2章,我们将会更加详细地对其进行相应 的解析与检验。在通常情况下,相应的交易者喜欢用布林带线的模式,从均值回归的价格序列当中攫取利润,所以,当相关的价 格点位超出(或跌破)临界值的时候,我们就会卖出(或买入)相应的金融产品。但是,如果我们被动地盯住线性的模型,那相 关价格的每一次增减都会强令我们卖出(或买入),从而使整体的市场行情走势相对于相应的均值水平来说,要么是正偏的,要 么是负偏的(对普通的交易者来说,此种现象被称为“轧平”或“缩放”)在第3章中,我们会对此类问题进行探讨。 读者可以在本书当中看到一些与线性交易模型相关的比较典型的案例,其中所涉猎的一些技巧是比较朴素和直观的,相关的 论述可以让我们知道:金融交易的收益并不是来自比较敏感的,且比较复杂的交易策略,也不是靠耍小聪明而得到的;其实,在 行情既定的情境之下,金融交易的收益来自相关市场的无效性2。如果你是一个缺乏耐心的读者,那就请你参看例4-2,其所展 示的是一个在交易型开放式指数基金与相关股票投资组合之间进行套利的、线性形式的均值回归交易策略,或者你可以参看例4- 3和例4-4,它们所展示的是:在股票交易中,我们应该如何运用多-空统计型策略进行套利的两种线性模式。 在线性预期模型当中最为极端的特定情境是:所有的相关系数的大小是一样的(数学符号不一定是一致的)。假设:你要攫 取大量的因子数据来预测明天股指的收益率,那么,你有可能选取今天的收益率作为相关的因子,而今天的收益率与明天的收益 率呈正相关性;你还可以参照相应股指于今天的波动率(VIX),其与明天的股指收益率呈负相关性。如果你选取几种类似的要 素作为影响因子进行评估的话,那你第一时间应该做的是:将相关因子规范化,即将其转换于标准化的程序当中(使用的是样本 内数据),其相应数理指令语言是 其中,f(i)指的是第i个因子,设明天的收益率为R,则 上述两个方程之中,mean(f)表示的是基于历史数据之各类f(i)值的均值,std(f)是各类f(i)值的标准 差,sign(i)代表的是基于历史数据的f(i)与R的相关系数,而mean(R)与std(R)各自所代表的是基于历史数据的日间收 益率的均值和标准差。诺贝尔经济学奖得主丹尼尔·卡尼曼在其一部畅销著作思考,快与慢中曾有如此论述:“对各类预测 性数据设置相同的权重所得到的公式是优越的,因为它不受单一样本相关的突发事件的影响。”(卡尼曼,2011) 式(1-2)是一个简化版的一般要素模型,经常被应用于预测股票的收益率。而其预测的绝对回报值可能是,也可能不是非 常准确。然而,其对于预测股票之间的相对回报来说,通常是足够好的。这意味着:如果我们用此模型来对股票进行归类、排 序,然后形成一个多空组合,买入高收益的股票,同时做空那些最差的股票,那么,在通常情况下,所建之投资组合的平均收益 率基本是正数。 在现实生活当中,如果你只是想对相关的各类股票进行排序,而不是计算相应的预期收益率,那么,除了前述的式(1-1) 与式(1-2)之外,还有一个简单的方法来测算f因子,即我们可以依据因子f(i)来计算相关各类股票的层级(注:股票排序结 果的相应函数为ranks (i)。译者注),然后,将相应的排序结果乘以因子f(i)与相应股票收益率的相关系数 sign(i),最后,将相应序列函数值进行叠加,从而得到总值ranks,相应方程为 注:sign(i)是符号函数,i0时,sign(i)=1;i=0时,sign(i)=0。译者注 举个例子说明一下:乔尔·格林布拉特曾经很好地采用双因素模型以“魔幻公式”来对相应的股票进行归类、排序,即 f(1)=资本回报率,f(2)=净收益率(格林布拉特,2006)。如果我们买入排名前30的股票,且持有1年,则19882004 年,相关的年化收益率为30.8%,相较于标准普尔500指数的12.4%的收益水平来说,依据线性体系所构建的模型是非常有效 的! 最后我要提醒大家的是:在你所进行的测试过程当中,无论你多么小心地去规避数据探测中所存在的误差,它总会于不知不 觉中渗透进你所构建的模型之内,因此,我们的测试方法要具有前瞻性,即“后来者居上”,同时,样本数据的攫取一定要遵循 真实可靠的原则;另外,具有前瞻性的测试可以采用模拟的方式进行,但相关模型最好是经历“真枪实弹”的洗礼(尽量用最小 的杠杆),如此则可以测试那些凭“纸上谈兵”的方法而难以触及的交易策略。如果我们发现在实时交易当中所获取的实际收益 率(按夏普比率计算)比回测系统所显示的收益率高出一半,那么,我相信大多数的交易者会非常高兴。 3.股票的拆分与股息的调整 当某只股票的发行份额由1份拆分成n份时,相应的股票价格就要除以n,然而,当某只股票拆分之前你拥有相当的份额,那 你的份额也会乘以n,所以相应的总市值实际上没有什么变化。但是在回测过程当中,我们只会习惯性地观察价格序列以确定相 应的交易信号,而不是以市值作为设定的前提条件来决定自己的交易行为。因此,除非在除权日之前我们将相关价格缩小n倍, 否则,在除权当天,我们会发现:相应的价格会急剧下跌,进而引发错误的交易信号。前述的情况在回测系统与实时交易系统中 同时存在,因此,在现实交易当中,我们于除权日开盘之前一定要将相应的、历史性的股票价格除以n(如果情况相反,即相应 资产份额从1合成至n,那我们就应该于除权日之前将历史性的金融资产的价格乘以n)。 与上同理,当某个公司基于其所发行的每股股票而发放一定金额的股息d(或配股),那么,相应的股票价格也要减去这 个“d”(不考虑市场行情的变化),这是因为,如果你拥有这只股票,那么,即使在整体市值没有变化的情况下,你也能以佣 金的形式于除权日之前获得一定数量的现金流(或股票)。因此,在回测系统当中,如果你在除权日之前不对相应的、历史性的 价格序列进行调整,那么,相关系统就会给出错误的交易信号,此种调整在除权日开盘之前也适用于实时的交易系统(对开放式 指数基金也适用,同时,在期权定价系统中,也需要进行此种调整,只是过程稍微复杂一些)。 你可以在很多网站看到股票拆分以及股息分配的信息,但是我觉得earning.com网站可以提供非常好的免费数据,它不仅可 以记录历史性的数据,还能够揭晓未来之股票拆分、分红配股以及除权的具体日期,从而可以使我们的自动化交易系统对此类事 件做出应有的预判。如果你对股票拆分与分红调整之后的数据感兴趣,那么你可以尝试着下载csidata.com网站上的数据。 4.数据库内相关个股是否退市之问题所诱发的误差项 如果你要对某一个股票交易的模型进行回测,要是相应的历史数据当中不包含那些退市的股票,那你在股票的取舍问题上就 会出现偏差。试想一下:如果你所使用的系统要求你在相关股票的最低点买入,且长期持有,然而在现实当中,此种交易策略是 不可行的,因为如果某个公司发行的股票价格一直在下跌,那么,这个公司有可能会破产,如果在最低点买入,那你相应头寸之 损失就是100%。但是,如果你的相关数据库不涵盖这些退市的股票,只选取那些一直存活的股票,那你的回测效果就会显得非 常完美,这是因为,在你将相应的策略运行于实时交易的时候,即使你无法对某些股票的未来进行预期,但如果你所购买的股票 虽然跌得很惨,可是最后却能“起死回生”,这样就会使你所应用的相应交易策略显得非常“伟大”。 其实,对相关数据是否涵盖退市股票的问题如果处理不好,那么,相对于应用均值回归策略的多头而言,是非常危险的,也 就是说:在前述的情境之下,单纯的多方头寸比多空并行的锁仓模式以及单纯的空方头寸要危险,原因在于:如前所述,摒弃退 市股票的做法使得买方的头寸在回测系统中得以膨胀,因为其符合低买高卖的原则。此外,因之而产生的偏差会使高卖而低买的 空方在回测系统中的表现不佳。然而,当某些股票的价格跌至0元时,空方的收益最大,但是这些股票又不体现于回测系统之 内,因此,相应而生的误差使得相关系统对股票的空头而言则“显失公平”。对于那些应用均值回归策略且采取多空并行模式的 交易者而言,其头寸会出现两种相反的情况,但是,前述系统所产生的误区会使多头收益之权重高于空头收益的比例,所以在近 似锁仓的情况下,即使风险得以降低却不能被完全消除。这里要说的是,前述的相关问题在动量模型中的危害不大,尤其是那些 有利可图的短期动量型交易模式可以使相应偏差所生成数据消弭于无形,只是回测效果就不那么“夺人眼球”了。 你可以从csidata.com网站购买那些摈弃了上述误差的历史性数据,类似的网站还有:kibot.com、tickdata.com和 crsp.com。或者,你也可以每天在自己的指标系统当中存储所有股票的价格信息从而修正相关的误差,然后,回测最接近当前 的三年之内的历史数据,从而降低相应的风险。 5.初级与综合性的股票价格 在美国,有许多股票在交易所、电子撮合交易平台以及资金暗池3之内进行交易,这些交易场所中比较有代表性的机构包 括:纽约股票交易所(NYSE)、纽交所高增长板市场(NYSE Arca)、纳斯达克(Nasdaq)、艾兰德公司(Island)、BATS 交易所4、机构计算机网络公司(Instinet)、Liquidnet公司5、彭博资讯公司(Bloomberg Tradebook)、高盛集团的 Sigma X黑池平台6、瑞士信贷集团(Credit Suisse Group AG)的“Crossfinder”暗池交易平台。当你查阅某只股票过往的 日收盘价之时,你会发现:其所反映的是当日所有交易时段之内的最后一个执行价格;同理,某一个历史性的日开盘价所反映的 是该日所有交易时段之内的第一个执行价格。然而,当你提交一个收盘市价委托或开盘市价委托时,你会发现:相应委托只能传 输到初级市场。例如,一个IBM公司股票的收盘市价委托只会传输至纽约股票交易所,SPY公司股票的收盘市价订单会传输到纽 交所高增长板市场,而微软公司股票的收盘市价委托则会传输至纳斯达克市场。因此,如果你的交易策略与开盘市价委托或收盘 市价委托有关联,那你就需要从初级市场攫取相应价格体系的历史数据,进而准确地回测你的交易模型。但是,如果你在回测系 统中使用综合市场的历史数据,那相应的测试效果就不会太理想。让我们详细地分析一下:如果你使用综合市场的历史价格来回 测相关的均值回归模型,那么,你的回测效果可能会过于乐观,因为在初级市场之外的交易场所,

    注意事项

    本文(算法交易:制胜策略与原理.html.pdf)为本站会员(紫竹语嫣)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开