量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。
虽然量化交易存在的历史已经有几十年了,但是直到2010年,量化投资才逐渐进入大陆投资者的视野。这两年,采用量化投资模型的产品尤其火(一听名字就高大上啊),一旦跟量化沾上边(不管是真量化还是假量化),很容易受到投资者的追捧。学习和研究量化交易的人越来越多,在与时俱进中,细读了不少相关书籍。我们将结合自己的经验,分3篇来分享《量化交易--如何建立自己的算法交易事业》这本书的精华内容,普及量化投资的相关知识。
这本书不是量化交易技术或术语的百科全书,也不会专门介绍一些特殊的盈利策略,而是一本教你如何自己去寻找盈利策略的书。它会告诉你好的策略的特征是什么、如何识别策略的陷阱、如何通过对一个策略进行优化和回测来确认其是否具有良好的历史业绩以及评估策略的稳定性和可靠性。另外,它还会教你一些风险管理的基础知识,让你更好的长期在市场中生存下来。
这个读书精华总结分三篇,主要涉及的内容是如何寻找或者发现策略,以及如何迅速评估一个策略的优劣。这些方法在股票、商品、外汇等领域都是适用的。
第一篇我们先来看看如何识别优秀的量化交易策略。
科普部分
什么是量化交易?
量化交易也称为算法交易,是严格按照计算机算法程序给出的买卖决策进行的证券交易。
大家容易把量化交易与技术分析混淆,实际上量化交易的内容丰富的多。许多量化交易系统在进行建模和运算的时候会用到基本面数据,比如估值、市值、现金流等,还有的算法将新闻作为变量进行计算。而技术分析基本只需要用到交易标的的量价数据。
定量投资和传统的定性投资本质上来说是相同的,二者都是基于市场非有效或弱有效的理论基础。两者的区别在于定量投资管理是“定性思想的量化应用”,更加强调数据。量化交易具有以下几个方面的特点:
1、纪律性。根据模型的运行结果进行决策,而不是凭感觉。纪律性既可以克制人性中贪婪、恐惧和侥幸心理等弱点,也可以克服认知偏差,且可跟踪。
2、系统性。具体表现为“三多”。一是多层次,包括在大类资产配置、行业选择、精选具体资产三个层次上都有模型;二是多角度,定量投资的核心思想包括宏观周期、市场结构、估值、成长、盈利质量、分析师盈利预测、市场情绪等多个角度;三是多数据,即对海量数据的处理。
3、套利思想。定量投资通过全面、系统性的扫描捕捉错误定价、错误估值带来的机会,从而发现估值洼地,并通过买入低估资产、卖出高估资产而获利。
4、概率取胜。一是定量投资不断从历史数据中挖掘有望重复的规律并加以利用;二是依靠组合资产取胜,而不是单个资产取胜。
哪里可以找到策略思想?
交易策略 字面上看,策略就是计策和谋略,应该是智慧含量很高的一种计划或设计。在交易实践里,用来特指情境中的具体设计比较恰当。
我们在自己的研究和探讨当中,规定策略要严格使用,不惜缩小其外延和使用范围。包含计策和谋略等交易智慧的、具体的交易计划或设计,我们才称之为交易策略(狭义)。
交易策略的内容可以包括单独或具体交易的资金相关、机会相关、亏损相关和利润相关的安排和计划,且内容应当具有一定体系特征,具有严谨性、完整性和一定专业水平。
跟大家交流的时候,发现有一个普遍的问题,就是不知道怎样去寻找交易策略的想法。其实这是一个小问题。作者认为,寻找交易理念事实上并不是打造量化交易的最困难的部分,小善对此深表赞同。因为我们可以从网络上非常容易获得优秀的交易思想甚至已经写好的策略及其回测结果。
作者告诉了读者可以从金融投资方面的书籍、报纸杂志、主流媒体网站、学术论文、交易员论坛和博客等地方获得策略。无论是在国内还是国外,作者提供的这些渠道确实是可以找到很好的资料的。除了以上渠道之外,小善还经常通过以下方式学习和获得交易策略:
1、各大券商的研究报告。
根据2012年颁布的《发布证券研究报告执业规范》第十九条规定:证券公司、证券投资咨询机构应当通过公司规定的证券研究报告发布系统平台向发布对象统一发布证券研究报告,以保障发布证券研究报告的公平性。
在证券研究报告发布之前,制作发布证券研究报告的相关人员不得向证券研究报告相关销售服务人员、客户及其他无关人员泄露研究对象覆盖范围的调整、制作与发布研究报告的计划,证券研究报告的发布时间、观点和结论,以及涉及盈利预测、投资评级、目标价格等内容的调整计划。
法规说的比较官方,对投资者而言查阅研究报告有一些具体的指导性作用,各券商、投研机构在官方网站中会有研究报告的发布,包括宏观经济分析、行业研究、上市公司研究报告等等,投资者可以自行查阅。其他查阅渠道还有交易软件中各上市公司的信息、各主要财经网站、各种数据库(例如wind数据库)等。
这是一个非常好的学习资料来源,各大券商会有各种量化策略报告,包括基本面量化、技术指标量化、情绪指标量化等。这些报告中的一部分是以非常严谨的方式做的研究,得出结论的可靠程度是很高的,小善平时喜欢在WIND或者CHOICE金融终端里面打开金融工程这个专栏翻看报告,一些在量化研究里面做的很优秀的如国泰君安、海通这些大券商的报告是非常值得阅读的。
2、量化社区
国内的量化投资火起来后,量化社区发展壮大的速度非常快,目前人气比较高的国内社区有优矿、聚宽、米筐等,这上面汇集了不少矿工分享和讨论量化交易策略,社区还提供免费的回测平台供缺少数据的同学使用。其实国外的量化社区更丰富,如果英文足够好,去Bing或者Google一下就找到了。
有了上面的策略检索和分享来源,我们就可以接触到量化交易领域中绝大多数的策略思想了。
如何认识交易策略
下面这张图是小善从网上搜来的一个策略回测图线。光看图线走势,该策略是远胜于基准的。但它对你来说一定是个好策略吗?恐怕不能仅仅依靠看图来下结论。
我们来看看如何认识交易策略。
什么更宝贵,策略本身还是甄别策略的能力?
书中作者分享了一个有意思的小故事,大意是这样的,当作者在一家位于第五大道、管理着数十亿美元的对冲基金Millennium Partners工作时,亲眼看到一名交易员从他的程序员手中抢过一篇“公开发表”的论文,其实这名程序员只是碰巧从交易员的桌子上拿起来而已,但是那个交易员担心程序员知道他的“秘密”。可见,即便是绝大多数策略思想都是公开的,担心策略思想被他人知晓的也大有人在。
作者看来,那些你认为是秘密的策略多半早已为他人所知。一项策略真正的独有价值和值得保密的地方是你自己的窍门和所进行的变形,而绝不是基础版。对于量化交易研究者而言,真正困难的地方并不是缺乏交易理念,而是缺乏甄别策略的能力。这种甄别能力需要我们判断一项策略是否适合自己的实际情况和交易目标(比方说大基金用的策略要求资金容量大,这可能会以牺牲收益率为代价,但是小资金完全可以用大资金没法使用的更高收益率的策略),需要在花费大量时间进行回测之前就能判断出策略是否可行。
寻找适合自己的策略需要考虑哪些主要因素?
1、交易时间。自己是否有时间进行日间交易?如果没有,可能需要考虑隔夜持仓的交易策略。
2、编程水平。你只会Excel还是可以写Python、Java、C或者C++这些语言?如果只会Excel,可能做的交易策略会比用其他编程语言能做的交易策略简单一些。需要澄清的是:简单的未必是不好的。
3、资金规模。小的资金规模能够交易的股票数量少,同时也会限制对冲策略的规模,这都会影响交易策略的选择。
4、收益目标。你的收益目标需要综合考虑持有期和收益持续性之间的关系。
识别貌似可行的策略及其陷阱
当一个看上去不错的策略呈现在你面前的时候,如何去评价这个策略?这就是本篇文章的重点:识别貌似可行的策略及其陷阱。投资者可以使用这些方法快速评价拟投资产品所使用策略的好坏,量化交易爱好者也可以在进行严格的策略回测之前进行一次省时省力的评估。
1、策略与基准相比收益如何?收益的持续性如何?这个问题主要需要回答策略能否跑赢基准和是否有够高的稳定性。
2、挫跌多深、多久?
用作者的话说,如果一项策略近期正在亏钱,它就正在经历挫跌。时刻t的挫跌被定义为:当前净值(假定期间内未发生任何赎回或注资)与t时刻或之前的净值曲线最大值之差。“最大挫跌”是净值曲线最大值与之后的净值曲线最小值之差。净值的最大值又被称为“高水位线”。“最长挫跌期”是指净值重返亏损前的水平所花费的最长时间。探究这个问题的意义在于搞清楚:在投资组合清盘或策略结束之前,你能承受多深和多久的挫跌?是20%和3个月,还是10%和1个月?用图比较容易理解这个定义:
3、交易成本对策略的影响。
这包括两方面,一方面是因为证券买卖都会发生手续费,交易越频繁,成本对策略的盈利的侵蚀就越多。另外一方面是流动性成本,当你以市场价格买卖证券的时候,需要支付买卖价差。如果你用限价指令买卖证券,确实可以避免流动性成本,但是却要承担机会成本,因为你可能买不到或者卖不出去。
4、数据有无存活偏差?
股票价格的历史数据库往往不包括由于破产、退市、兼并或者收购而消失的股票,因为回测数据库中只有幸存者,所以会存在所谓的存活偏差。使用有存活偏差的数据进行回测是很危险的,因为这样会夸大策略的历史业绩。
5、策略的业绩如何随着时间的变化而变化?
这是一个很重要的问题,因为有很多策略早些年的业绩要远远好于现在,在出色的多年累计业绩之中,早些年或者某些年的贡献特别突出,我们应当对这种非常隐蔽的误导提高警惕,这背后主要有两方面的原因:一方面是数据的存活偏差导致,回测回溯的越早,消失的股票也越多,偏差就越大。另外一方面是金融市场随着制度变化或者交易者的构成的变化会在底层生态上面存在“状态转换”,因此可能出现在之前某段时间内该策略表现特别好但是后来表现平平的情况。考虑到这两方面的原因,我们应当重点关注某个策略近几年的表现。
6、策略是否存在数据迁就偏差?
数据迁就偏差的本质是通过对参数进行过度的优化,令策略历史业绩看上去非常棒,这会产生什么问题呢?数据迁就偏差的本质是经过过度优化之后呈现的数据模式已经远远偏离真实世界,使得模型与过去发生但是未来不会再重现的任何偶然历史事件吻合,其结果就是该策略的未来业绩与回测结果截然不同。一般而言,策略的规则越多,模型的参数越多,就越有可能发生数据迁就偏差。用通俗的话说,如果用一个集所有你喜欢的女星之优点的美女作为模板去找老婆,能找到才怪。
最重要的一点:深刻认识盈亏同源
说了这么多,小善觉得无论对于投资者还是交易者而言,以上对量化交易策略优劣的快速评价方法应该都是很有启发的。但是小善在这里还想特别强调一个事情,即天下没有完美的策略,就如同天下没有完美的老婆一样。如果一个策略是整体来看是赚钱的并且你打算使用,你就要忍受他的缺点,如果你无法忍受缺点,那你就不要用这个策略,或者不要买使用这个策略的产品,因为盈亏同源。
任何一个策略,都无法做到百分之百盈利,亏损是策略的一个不可分割的部分。用更为通俗的话来说,你的盈利和你的亏损的本源是一致的,这同样的本源带来了收益也同时带来了亏损,如果你试图躲开亏损,那你必然也同时躲开了盈利。只有正确深刻地认识到这一点,你才有可能以正确的态度面对策略中的亏损、正确的评估最大挫跌和最长挫跌自己是否可以忍受,只有正确地认识了亏损,你才有可能稳定和持续地盈利。