AI应用开发堆栈


模型开发

基础模型

  • 数据体系
  • 数据集/语料
  • 标注系统
  • 管线系统

  • 模型体系

  • 深度
  • 参数
  • 模态
  • Token

  • 集群体系

  • 多卡并行
  • RDMA带宽
  • 基于以太网/HPC的通讯调度

  • 训练体系

  • 指令调试
  • 正则化/Epoch优化等

  • 对齐体系

  • 自然语言
  • 代码
  • 价值观/安全

  • 评估体系

  • 系统化的工程体系
  • 性能
  • 成本
  • 多维度优化

  • 垂直/领域模型

  • 基于已有大模型

    • 知识蒸馏
    • 微调或提示
    • PEFT
  • 领域数据集

  • 语言学知识/知识图谱
  • API工具和服务

  • 多模态/扩散模型

  • 数据系统
    • 标注数据集
  • 模型系统
  • 可扩展Transformer
  • U-Net等结构优化
  • 采样/推理优化

  • 工程系统

  • 编译/硬件优化

  • 轻模型(局部可运行的) 模型

  • 知识蒸馏
  • 量化优化: FP32
  • 结构优化
  • 内存优化

开源模型/数据集

  • 编码器
  • 解码器
  • 活跃模型系统
  • 重要数据集/系统

应用开发

工具箱工具链

基础开发能力

  • 代码框架
  • 基础服务
  • 工作流
  • 代理
  • 编制
  • 整合
  • 提示
  • 调试
  • 记忆

扩展开发能力(自然语言)

  • 抽象层次
  • 知识结构
  • 推理机制
  • 规划能力
  • 执行框架

开发对象& 资源

运行时

  • 后端

云和服务

其他资源