“电风扇”行情下量化策略新思路:双目标遗传规划如何捕捉周频轮动机遇?

“电风扇”行情下量化策略新思路:双目标遗传规划如何捕捉周频轮动机遇?

11分钟 ·
播放数21
·
评论数0
20240520-华泰证券-双目标遗传规划应用于行业轮动

报告概述

本报告详细阐述了华泰证券提出的一种基于双目标遗传规划模型的周频行业轮动策略。该策略旨在应对当前市场主线强度减弱、行业轮动加速的挑战,尤其是在传统月频行业轮动模型表现不稳定的背景下。双目标遗传规划通过同时优化IICI(信息系数)和NDCG@k(归一化折损累计增益),有效地平衡了因子单调性和多头组表现,显著提升了因子挖掘的有效性和策略的超额收益。

主要发现和核心观点

1. 市场环境变化推动周频轮动策略需求

自2022年第三季度电力设备及新能源行业行情结束后,A股市场主线强度转弱,行业轮动速度加快,导致传统的月频行业轮动模型难以持续稳定获取超额收益。

  • 月频模型表现下滑:“2022年9月之前,模型相对于全体行业等权基准的年化超额收益约为17%;而2022年9月之后,年化超额收益就下降至了约7%。”
  • 换手率提升:2022年9月之后,月频行业轮动模型的换手率提升了约40%,表明“一个行业投资机会的持续时间变短了”。
  • 市场主线指标下降:市场主线强弱指标的均值下降,且超过强主线阈值月份的比例下降,相关系数为+0.36,说明“市场主线越强,月频行业轮动模型越容易获得超额收益”。

面对这一变化,研究转向了周频行业轮动策略,并尝试引入人工智能等高级因子挖掘手段,因为“像MACD、KDJ等常见技术指标在周频行业轮动场景中几乎全部失效”。

2. 双目标遗传规划模型的核心优势

传统的单目标遗传规划在因子挖掘中存在“因子评价维度不全面”和“严重的种群拥挤问题”等痛点。双目标遗传规划通过引入NSGA-II算法和多维度适应度函数来克服这些问题。

  • 多维度适应度函数
  • IICI(信息系数):“IICI侧重因子单调性”。
  • NDCG@k(归一化折损累计增益):“NDCG@k侧重多头组表现。” NDCG@k关注多头组的实际收益,因为它“会给予多头组表现更高的关注度”,这对于行业轮动投资者的实际收益至关重要。
  • 两者结合:“希望遗传规划得到的因子同时具备较高的IICI和较高的NDCG@k,因为如果NDCG@k较低,意味着多头组表现不佳;如果IICI较低,意味着因子单调性不好,会给多因子线性合成造成麻烦。”
  • 保持种群多样性
  • NSGA-II算法:在子代选择阶段采用NSGA-II算法,通过“非支配排序”和“拥挤距离”概念,形成了“双目标的对抗”,有效减缓了“种群拥挤的速度”。
  • 分小种群进化:将初始种群分为若干小种群,每个小种群独立执行遗传规划流程,防止“超强基因”垄断整个种群,从而“其他小种群中的优秀‘基因’依然有机会得以保留。”
  • 种群规模远大于进化次数:例如,种群规模设置为2500,进化次数设置为10,以“在有限的进化次数内,即使发生了极端的种群拥挤,种群多样性依然能够保持在一个可以接受的水平。”

3. 模型表现显著优于单目标遗传规划

  • 实证结果:在2022年9月30日至2024年4月30日的回测区间内,“双目标遗传规划周频行业轮动模型的扣费前年化超额收益为25.74%,夏普比率1.70,最大回撤-21.47%,显著优于单目标遗传规划模型的表现;年化换手为单边约13倍。”
  • 消融实验对比:消融实验表明,仅以IICI或NDCG@k为适应度函数的单目标遗传规划模型表现“与双目标遗传规划模型的表现均呈现天壤之别”,尤其以NDCG@k为单目标时,“截至报告发布日仍跑输行业等权基准。” 这有力证明了双目标优化结合的重要性。

4. 因子挖掘流程与实践细节

  • 重训练机制:模型每隔3个月重新训练一次,以适应市场变化,挖掘历史规律。
  • 降低随机因素干扰:每次重训练日,设置6个不同的随机数种子执行6轮因子挖掘,并使用贪心策略将结果合成为综合因子。
  • 回测与评估:一个滚动窗口包含训练集(约5年)、验证集(约半年)和测试集(约半年)。验证集和测试集直接使用多头组超额收益进行评估,并要求“测试集表现相对于验证集表现未显著衰退”,通过单边t检验p值来判断因子失效程度。
  • 多因子合成:通过贪心策略将验证集和测试集上表现优异(信息比率降序排名前10)的因子合成为综合因子,合成权重与因子失效检验p值相关。综合因子还会进行10个交易日的指数移动平均,以降低换手率并利用近期因子信息。
  • 常用算子与PyTorch实现:遗传规划算子补充到64个,并使用PyTorch实现,以便未来可能扩展到需要GPU加速的选股场景。

5. 挖掘出的“优秀”因子特性与未来展望

  • 因子特征:在回测区间内,时序切割因子和成交额相关变量被频繁识别为“优秀”基因。“时序切割的思想是‘分域建模’”,“成交额相关变量的频繁出现,可能是因为回测区间内A股市场缺乏增量资金,量对于把握行业投资机会可能更为重要。”
  • 工程改进空间
  • 提升随机数种子的控制范围(目前仅控制初始化,未控制交叉变异)。
  • 加入更多输入数据(如基本面数据)和更多功能的算子。
  • 为算子增加限制性条件,缩小无效搜索空间。
  • 在算力允许的情况下,适当提高重训练频率,应对因子过快失效风险。

风险提示

报告中强调了潜在风险:

  • 遗传规划挖掘的历史规律可能在下次重新挖掘之前失效。
  • 月频和周频行业轮动模型各有适用市场条件,无法保证在任何市场条件下均可取得超额收益。
  • 涉及的具体行业不代表任何投资意见,提醒投资者谨慎理性看待。

总结

华泰证券提出的双目标遗传规划模型,通过在因子挖掘过程中引入多目标优化(IICI和NDCG@k)和精英选择策略(NSGA-II算法),有效克服了传统单目标遗传规划的局限性,特别是在当前A股市场行业轮动加速的背景下,展现出强大的适应性和优异的超额收益表现。这一研究不仅为量化投资领域的因子挖掘提供了新思路,也为未来拓展到更复杂的选股场景奠定了基础。