【研究报告内容摘要】
选股模型的时效性信息具有时效性。选股因子对股票收益率的预测能力会随着时间的延后而衰减。机器学习股票收益预测模型的目标是将股票因子与股票未来收益率关联起来。股票因子蕴含的信息决定了模型的预测能力,包括预测准确度和预测窗口长度。如果机器学习模型所用的股票因子中包含的是市场短期情绪面的信息,那么训练出来的机器学习模型可能对市场短期走势的预测能力较强;如果机器学习模型所用的因子包含的是市场中长期的价格扭曲信息,那么训练出来的机器学习模型可能对市场中长期的预测能力较强。
模型构建本报告按照因子在不同预测窗口长度的 ic 将选股因子分成不同的组别,并针对不同的股票收益预测问题,分别构建机器学习预测模型,包括短线预测模型、中线预测模型和长线预测模型。
实证分析实证分析表明机器学习模型在不同预测窗口长度的股票收益率预测上都能够取得不错的效果,基于不同机器学习模型构建的选股策略均表现出不错的性能。机器学习选股因子的 ic 和 icir 会随时间衰减,在高调仓频率的选股策略中,短线预测机器学习模型表现较好;在低调仓频率的选股策略中,长线预测机器学习模型表现较好。由于机器学习模型的性能随着预测窗口的增长而减弱,提高换仓频率一般会获得更好的收益表现。在千分之三的换仓成本下,相对月频或季频调仓,周频调仓是机器学习模型更合适的一个调仓频率。
不同机器学习选股因子的相关性不高,因此可以将不同模型的选股因子集成进行多模型选股。在周频调仓下,模型 s、模型 m 和模型 l三模型集成选股策略的年化超额收益为 38.97%,夏普比率为 3.89,显著优于单模型的选股表现,而且模型的换手率也比中短线预测模型的换手率要低。
风险提示策略模型并非百分百有效,市场结构及交易行为的改变以及类似交易参与者的增多有可能使得策略失效。