大模型(Large Model)通常指参数规模巨大(通常在数百万到数千亿级别)的机器学习模型。这类模型能够捕捉数据中的复杂模式,广泛应用于自然语言处理(NLP)、计算机视觉和生成式人工智能等领域。典型的大模型包括:
- 大语言模型(LLMs):
- GPT 系列(如 GPT-3、GPT-4)
- BERT(双向编码器表示模型)
- LLaMA(Meta 开发的大语言模型)
-
PaLM(Google 的 Pathways 语言模型)
-
视觉模型:
- Vision Transformers(ViT)
- DALL·E(图像生成模型)
-
Stable Diffusion(生成式图像模型)
-
多模态模型:
...