这篇论文提出了一种名为CausalStock的模型,用于预测受新闻影响的多只股票价格走势,核心内容如下: 1. 研究背景:在预测多只股票价格走势时,现有方法存在两个问题。一是股票关系常为单向,以往基于相关性的关系建模不合适,因果关系更能准确反映股票间影响;二是新闻数据噪声大,传统文本挖掘模块难以提取有效信息。 2. 创新点 - 因果关系发现:设计了与时间滞后相关的因果发现模块,能根据时间滞后直观地建立股票间的因果关系,比以往不考虑时间滞后的方法更适合股票数据。 - 新闻信息提取:提出基于大语言模型(LLM)的去噪新闻编码器。它能从多个角度给新闻文本打分,有效去除噪声,提取有用信息,丰富新闻表示形式。 - 整体模型:CausalStock模型由市场信息编码器、滞后相关的时间因果发现模块和功能因果模型组成。市场信息编码器处理新闻和价格数据;因果发现模块挖掘股票间因果关系;功能因果模型根据因果关系预测股票价格走势。 3. 实验结果:在6个真实世界数据集上进行实验,涵盖美国、中国、日本和英国市场。CausalStock在预测准确率方面优于其他对比模型,无论是有新闻数据的多股票走势预测任务,还是无新闻数据的任务都表现出色。通过消融实验表明,模型各个组件都对性能有贡献。并且该模型可解释性强,能清晰展示新闻对股价的影响以及股票间因果关系。在投资模拟中,CausalStock也展现出良好的风险收益平衡能力。 4. 未来方向:未来可以采用元学习或增量学习方法迭代更新因果图,探索时变因果关系。同时,当前用伯努利分布判断因果关系存在局限性,后续可尝试更复杂分布来深入研究因果关系的多层次特性。
CausalStock: Deep End-to-end Causal Discovery for News-driven Stock Movement Prediction