1. 数据收集与处理
1.1 数据源
- 基础数据:A股的历史交易数据,包括
开盘价
、收盘价
、最高价
、最低价
、成交量
等,可以使用Tushare
或Akshare
等API进行获取。 - 数据频率:需要5分钟级别的OHLCV数据。这意味着每5分钟会有一次更新的数据点。
- 市场情绪与资金流向:除了价格数据,情绪数据(新闻、社交媒体)和资金流向(主力资金、行业资金等)是非常重要的。可以通过
舆情分析
、热度分析
以及资金流向
来增加模型的预测能力。
1.2 数据清理与预处理
- 缺失值与异常值处理:金融数据常常存在缺失或异常,需要使用插值法、均值填充、异常值检测(如IQR、Z-Score)等技术来处理。
- 时间序列...