TradExpert: Revolutionizing Trading with Mixture of Expert LLMs


“TradExpert: Revolutionizing Trading with Mixture of Expert LLMs”提出了TradExpert框架,该框架利用专家混合(MoE)方法,整合多个专注于不同金融数据的大语言模型(LLM),以提升股票交易策略。 1. 研究背景 - 人工智能与金融分析的融合催生了创新时代,大语言模型(LLMs)在金融领域的应用逐渐增加,但有效整合不同数据源及结构化与非结构化数据仍是挑战。 - 此前传统金融模型难以处理非结构化数据,虽有通用LLMs及专门的金融语言模型出现,但仍需更好地综合不同数据来源的见解。 2. 研究目的 - 提出TradExpert框架,整合多个LLMs分析不同金融数据,以预测股票走势并指导交易策略。 - 利用LLM作为比较器在宽松排序算法中选择排名靠前的股票进行交易。 - 发布一个综合数据集,为金融分析提供新基准。 3. 方法介绍 - 框架组成 - 专家LLMs:包括新闻分析师LLM(分析新闻文章预测股票走势,采用思维链推理并由GPT - 4生成推理依据)、市场分析师LLM(分析历史OHLCV数据,通过重编程机制将时间序列数据转换为文本原型表示)、Alpha专家LLM(处理基于表达式的alpha因子,利用GPT - 4生成因子描述,计算综合得分并选择关键alpha因子)和基础分析师LLM(分析基本面数据预测季度股票价格走势)。 - 通用专家LLM:有预测和排名两种模式。预测模式总结专家报告后预测股票涨跌;排名模式通过比较两只股票表现确定优劣,采用宽松比较排序算法(基于LLM比较器的非传递性选择该算法)对股票进行排名。 - 数据集:收集了2020年1月1日至2023年12月31日涵盖新闻、市场数据、alpha因子和基本面数据的综合数据集,并按时间顺序划分为训练、验证和测试集。 4. 实验结果 - 股票走势预测:在多个基准数据集和专有数据集上进行实验,TradExpert - NM在除ACL18数据集的MCC指标外的所有数据集上表现优于其他模型,证明了其有效性。 - 股票交易模拟:在道琼斯30指数成分股上进行回测,TradExpert采用买入并持有策略,在年化收益率、夏普比率、年化波动率和最大回撤等指标上表现出色,显著优于传统模型和深度学习模型。 - 消融实验 - 专家影响:市场分析师和新闻分析师对盈利能力和风险管理影响最大,Alpha专家影响较小,基础分析师对长期稳定性有贡献。 - 结构化数据推理有效性:TradExpert - MA在处理结构化数据时比传统模型和alpha因子组合更有效。 - 排序算法选择:宽松比较排序算法尽管计算复杂度高,但由于LLM比较器的非传递性,能产生更准确的排名。 5. 研究结论与展望 - 提出的TradExpert框架通过整合多个专家LLMs在股票交易策略上表现优异。 - 未来计划探索TradExpert在高频交易场景中的应用,并扩展其能力以涵盖更多全球市场。 6. 研究局限 - TradExpert处理单只股票平均需4.7秒(使用Nvidia A5000 GPU),在高频交易等对决策速度要求高的场景中存在延迟问题。