AlphaNet因子挖掘网络


运算符嵌套和卷积神经网络

全文总结 本文主要介绍了对 AlphaNet--V1 模型进行改进得到 AlphaNet--V3 模型的过程,以及与随机森林模型进行比较。具体内容包括在 AlphaNet--V1 基础上加入多步长的特征提取层、将池化层替换为门控循环单元(GRU)、调整预测标签值、训练和测试模型、与随机森林模型对比等。 重要亮点

  • AlphaNet-V1 的不足与改进方向:AlphaNet-V1 给出的标签预测值几乎都为常数,不理想。因此在 AlphaNet-V3 中进行两方面改进,一是调整网络结构,加入不同步长的特征提取层并将池化层转换为 GRU;二是调整标签值,转换为涨跌方向和超额收益方向。
  • 加入多步长特征提取层:在 AlphaNet-V1 的固定步长特征提取层基础上,加入步长为 3 的特征提取层,通过自定义函数生成不同步长的索引列表,传入自定义的 Inception 类实现平行的特征提取层。
  • 将池化层替换为 GRU:AlphaNet-V1 的池化层会丧失时序信息,将其转换为 GRU 可以接受时序输入并输出带有时序记忆的隐藏状态。自定义 GRU 层并嵌入到 Inception 类中,保留特征提取层输出的时序信息。
  • 训练和测试 AlphaNet-V3 模型:AlphaNet-V3 模型更复杂,训练时需要更多轮次才显现收敛趋势。绘制训练集和测试集上损失的变化,比较部分样本标签的预测值和真实值,发现预测效果不理想,考虑转换预测目标。
  • 调整预测目标:分别将预测目标调整为收益率的方向和超额收益率的方向,进行相应代码调整,绘制 ROC 曲线和混淆矩阵评估预测效果,结果表现一般。
  • 与随机森林模型比较:以“超额收益率的方向”为预测目标,将随机森林模型作为 baseline,介绍其分类预测过程,输出模型评价指标,进行特征重要性排序,发现最重要的特征几乎都为 vwap。

AlphaNet因子挖掘网络——运算符嵌套和卷积神经网络