幻方量化在其量化投资与AI技术中主要使用了DeepSeek系列模型,特别是DeepSeek-V3和DeepSeekMoE模型。以下是具体分析:
1. DeepSeek-V3:核心量化投资模型
-
性能与定位
DeepSeek-V3是幻方量化自主研发的大模型,其性能对标国际顶尖闭源模型如GPT-4o和Claude-3.5-Sonnet,在英语、数学、代码、多语言任务等多项评测中表现优异。该模型还被用于高频交易决策、风险管理及多模态数据分析,帮助幻方量化快速捕捉市场波动并优化投资策略。 -
技术特点
- 高效低成本:训练成本仅为557.6万美元(基于H800 GPU租用价格),约为GPT-4的二十分之一,同时生成速度较上一代模型提升3倍。
- 多模态支持:能处理文本、图像等数据,增强投资信号挖掘的全面性。
- 高频交易能力:通过快速响应市场变化,执行高频交易策略,提高盈利效率。
2. DeepSeekMoE:开源混合专家模型
- 架构创新
作为国内首个开源MoE(混合专家)大模型,DeepSeekMoE采用细粒度专家划分和共享专家分离技术,显著降低计算资源消耗。例如: - DeepSeekMoE-16B仅需40%的计算量即可达到LLaMA2 7B的性能。
-
145B规模的模型在计算效率上超越Google的GShard架构。
-
应用场景
该模型主要用于提升大语言模型的效率和精准度,可灵活部署于量化策略开发、数据特征提取等环节,支持幻方量化在算法优化和成本控制上的需求。
3. 模型的应用与争议
- 市场影响
DeepSeek系列模型因其高性价比和开源策略,引发国内大模型市场价格战,并受到国际科技界关注,被外媒评价为“中国AI技术快速追赶的象征”。 - 争议与挑战
尽管模型技术领先,但幻方量化的基金业绩并未因AI技术的突破而显著提升,部分基金甚至出现下滑,引发对其技术与实际投资效果关联性的讨论。
总结
幻方量化的模型布局以DeepSeek-V3为核心驱动量化投资,辅以DeepSeekMoE的开源生态扩展技术影响力。其技术优势体现在低成本、高效率及多模态处理能力,但也面临技术与业务协同成效的质疑。如需进一步了解模型的技术细节或应用案例,可参考相关来源。