BloombergGPT 是彭博社(Bloomberg)开发的一个专门针对金融领域的大型语言模型(LLM),旨在支持金融行业的自然语言处理(NLP)任务。以下是关于 BloombergGPT 的详细介绍:
1. 模型概述
- 参数规模:BloombergGPT 是一个拥有 500 亿参数 的自回归语言模型,基于 BLOOM 模型的自回归结构,包含 70 层 Transformer 解码器。
- 训练数据:模型使用了 7000 亿个 token 的训练语料库,其中 3630 亿个 token 来自金融领域数据集(FinPile),3450 亿个 token 来自通用数据集(如 The Pile...