在开发量化投资策略时,海外优秀论文往往能够提供新的思路和方法,为了能够让各位投资者更有效率地吸收海外的经验,东兴金工团队推出海外文献速览系列报告。我们将定期从海外文献中筛选思路较为新颖且有潜力应用于国内市场投资的文章,以速览的形式呈现给各位投资者,内容涵盖资产配置、量化选股、基金评价以及衍生品投资等多个方面。
量化选股是一个热门的学术研究领域。尽管在量化模型和过程方面已经做了很多工作,但仍有一些地方可以改进。首先,在预测目标的设定上,以往的研究往往以股票收益率或价格是上涨还是下跌作为预测目标,但收益率往往包含一些噪声,而两种分类(上涨还是下跌)的设定并没有捕捉到很多现有信息。其次,在因子选择方面,以往的研究往往是静态地选择因子,但因子通常在一段时间内是有效的,之后可能不再有效。在本文中,作者提出了一种可持续的量化选股策略,它能在长期内在熊市、牛市和波动市场上运作良好。
在本文中,作者使用随机森林模型为训练集在每个时期动态选择因子,以确保每个时期可以选择的因子是当期的最优因子。
同时,对股票收益进行分类概率预测(CPP)。该方法可以有效兼顾收益预测的准确性,避免噪声对收益率的干扰。
CPP 量化选股策略设计的基本思路可简单概括为如下几步:第一步,将每只股票按月收益率分入5 个区间,通过随机森林(RF)模型将因子筛选到模型中;第二步,通过重新组合每个时期的因子和收益率区间来构建训练集和测试集;第三步,使用RF 模型来预测每个训练集的因子的重要性,并按重要性降序排列,采用动态因子选择法来选择当期最重要的因子;第四步,使用XGBoost CPP 方法进行分类预测,将每只股票分入5 个收益率区间并按概率降序排列,将概率最高的前20 只股票纳入股票池,调整仓位时卖出股票池之外的股票并买入池中的新股票。
作者指出,拟合选股方法容错性相对较低,并且收益中的噪声通常很大,回归错误的概率通常很高,容易造成较大的最大回撤。多类概率预测选股策略不是选择预测收益率最高的股票,而是要在确定预期收益率的区间之后,选择该区间内收益率最高的股票,这种方式使得选股准确率和容错率都得到了提高。历史回测表明,基于动态因子调整的CPP 量化选股策略表现优于传统的机器学习选股方法,在大部分回测期内均能跑赢同期的沪深300 指数。
作者对量化选股策略的研究方法值得我们学习和借鉴。作者运用机器学习方法在因子动态调整方面的创新值得我们关注。
风险提示:
本报告内容来源于相关文献,不构成投资建议。文中的结果基于原作者对历史数据的回测,当市场环境发生变化的时候,存在模型失效的风险。
来源:天天基金网