量化选股是指利用数量化的方法选择股票组合,期望该股票组合能够获得超越基准收益率的投资行为。
1、多因素模型(Multiple-factor regression)
Ross(1976)建立了套利定价理论 (Arbitrage Pricing Theory,APT) 。在投资实务中,多因素定价(选股)模型可以看作是APT理论最典型的代表。多因素模型将那些引起证券价格联动的因素直接加入到收益率公式之中,然后开发基于这些因素的模型,简化投资组合分析所要求的关于证券之间相关系数的输入。模型效果的好坏主要取决于因素的选取,即那些被选定的因素是否足以证明,证券收益率之间联动效应的根源在于那些因素对各证券的共同影响。对于因素的选取可以采用逐步回归和分层回归的方法进行筛选,然后进行主成分分析,从众多因素中找出解释度较高的某几个指标,尽可能反映原来所有的信息。另外,多因素模型进一步提出,证券之间的联动性,除了源于市场因素的影响之外,还取决于其他一些非市场因素。
2、动量反转选股
动量反转策略的起源可以追溯到有效市场理论的起源。1900年法国数学家Bachelie首先发现股票价格的变化服从布朗运动,但这一发现当时并没有受到广泛的关注。 直到1950年Kendall在经济时间序列分析中强调股票遵循随机游走的模型之后,现代资本市场理论体系才得到了长足的发展。这一理论一经问世,很多学者对其进行了大量的研究,其中包括Samuelson、Mandelbort和Fama。有效市场假说分三个层次,分别为弱有效市场、 半强有效市场、 强有效市场分别代表价格反映了历史信息、公开信息和全部信息。学术界对有效市场假说的检验分为两类:一是股价收益率分布的检验;二是市场有效性的检验。正是对市场弱有效的检验产生了动量反转策略。
动量效应(Momentum Effect)指的是投资策略或组合的持有期业绩方向和形成期业绩方向一致的股价波动现象;而反转效应(ContrarianEffect)则指的是投资策略或组合的持有期业绩方向和形成期业绩方向相反的股价波动现象。对于动量和反转效应,学术界有很多解释,其中比较具有说服力的是行为金融学的解释:反应不足和反应过度。如果在市场上发现了动量效应,说明股价对信息反应不足,股价在消息公布后不是第一时间上涨或下跌至其应有的位置,而是较为缓慢的移动至其应有的位置;同理,如果在市场上发现了反转效应,则可说明股价对信息反应过度。由此可见,动量效应与反应不足、反转效应与反应过度,这两组概念是紧密联系在一起的。动量效应和反转效应可以看作是反应不足与反应过度的实证支持。在使用动量反转方法选股的时候,需要考虑以下几个问题:样本选择的区间、不同策略在不同市况下的表现、持有期的长短、显著性检验等。
3、分类和回归树(Classification and regression tree)
分类和回归树是数据挖掘技术的一种,以递归分割技术为基础(常用于制药学的研究),包括分类树和回归树:分类树产生定性输出,回归树处理定量输出,分类和回归树可以用来提取规则和输入和输出变量之间的映射关系。输入数据通过与分裂节点的分割条件作比较,决定其属于左节点还是右节点。不断重复上述过程,就可以得到该输入数据的分类结果.从根节点到叶节点的所有分割条件则指明了输入变量对应输出结果之间的规则。 分层决策树采用替代变量的方法解决缺失数据问题,不要求数据的分布,可同时利用各种类型的数据。
4、神经网络(Neural networks)
因为股市的建模与预测所处理的信息量往往十分庞大,因此对算法有很严格要求,它的非线性动力学特性也非常复杂,所以一般传统的方法对于股市的预测往往难如人意。人工神经网络不仅具有大规模并行模拟处理、网络全局作用和非线性动力学等特点,而且有很强的自适应、自学习以及容错能力,具备传统的建模方法所不具有的许多优点,其可以不必事先知道有关被建模对象的参数、结构以及动态特性等方面的知识, 对被建模对象经验知识要求不高。 而只需给出对象的输入和输出数,通过网络本身的学习功能即可实现输入和输出之间的映射。人工神经络模型具有巨量并行性、存储分布性、结构可变性、高度非线性、自学习性和自组织性等特点,可以逼近任何连续函数,目前作为非线性函数的逼近模型被广范应用。神经网络目前在国际上已广泛用于金融分析和预测,并取得了较好的效果。人工神经络模型已在多变量非线性系统的建模方面取得了惊人的成就,成为一种新兴的预测时间序列方法。