冯佳睿
海通金融工程研究首席分析师
S0850512080006
投资要点
系列前期报告从高频指标序列出发,使用RNN+NN的模型架构训练生成了深度学习高频因子。回测结果表明,该类因子具有较为显著的周度选股能力。在报告发布后,我们得到了许多有建设性的反馈。在总结多方面信息后,本文在9个方面对模型进行了尝试性的改进,并展示了测试结果。需要注意的是,并非有所的尝试都能提升模型表现,但是考虑到深度学习模型在搭建中具有较高的试错成本,本文展示了所有尝试的结果,希望与大家进一步交流。
尝试1:训练中控制因子与行业、风格及低频技术因子的相关性。在训练过程中引入正交层,使模型在指定的正交约束下生成高频因子。相同参数下,新因子有更强的周度选股能力,添加至中证500增强组合中,也能取得更大的收益提升。
尝试2:输入特征压缩。基于人工逻辑压缩输入特征集合,由此训练得到的因子,选股能力并未减弱。
尝试3:调整特征标准化方式。在处理输入特征时,有不处理、时间序列标准化和截面标准化三种方式。对比三者训练得到的因子的选股能力可知,截面标准化效果最好、不处理次之、时间序列标准化较弱。
尝试4:提升输入特征频率。将输入特征的频率提升至10分钟,并未改善因子的选股能力。我们猜测,当输入特征的频率较高、序列较长时,简单模型相对较弱的信息提取能力,无法训练得到更有效的因子。
尝试5:改变训练集/验证集切分比例。压缩验证集的长度,可将更多近期数据放入模型训练,进一步提升因子的选股能力。
尝试6:输入特征中引入环境变量。简单地引入环境变量,无法提升因子的选股效果,也不能增强模型应对不同市场环境的能力。
尝试7:调整预测目标。将模型预测目标调整为风险调整超额收益后,虽会小幅降低因子周均IC,但是会带来因子多头超额收益的提升。
尝试8:延长训练集。在更长的滚动训练窗口下,因子周度选股能力会得到进一步增强。
尝试9:提升模型复杂度。增加模型参数量并不能提升因子周度选股能力,这表明,当前模型的复杂程度可能已经足够从输入特征中提取有效信息。若想要使用更复杂的模型,可考虑扩充输入特征的信息量。
风险提示。市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。