生成式AI入门与AWS实战


《生成式AI入门与AWS实战》读书摘要

一、书籍简介

《生成式AI入门与AWS实战》是一本由O'Reilly出版的技术书籍,作者包括克里斯斯·弗雷格利(Chris Fregly)、安特耶·巴特(Anteye Barth)和舍尔比·艾根布罗德(Shelbee Eigenbrode)。本书主要介绍了如何在AWS平台上进行生成式AI的实践操作,涵盖了从基础理论到实际应用的各个方面。

二、主要内容

  1. 基础概念

• 介绍了生成式AI的基本概念和应用场景,包括不同类型的生成式模型,如语言模型、图像模型等。

• 探讨了基础模型和模型中心的概念,为后续的实践操作打下理论基础。

  1. 技术实践

• 详细讲解了如何在AWS上构建生成式AI应用程序,包括模型的训练、微调和部署。

• 涉及到多种技术工具和框架,如Stable Diffusion、ControlNet等,用于实现不同的生成式任务。

  1. 实际应用

• 书中提供了多个实际案例,帮助读者理解如何将生成式AI应用于具体的业务场景,如数据隐私和网络安全等。

• 讨论了如何通过人类反馈进行强化学习微调,提高模型的性能和准确性。

目录

  1. 生成式AI用例、基础知识和项目生命周期 1.1 生成式AI用例和任务 1.2 基础模型和模型中心 1.3 生成式AI项目生命周期 1.4 AWS上的生成式AI 1.5 为什么选择基于AWS构建生成式AI 1.6 在AWS上构建生成式AI应用程序 1.7 小结

  2. 提示工程与上下文学习 2.1 提示与补全 2.2 token 2.3 提示工程 2.4 提示结构 2.5 通过少样本推理进行上下文学习 2.6 提示工程实践 2.7 推理配置参数 2.8 小结

  3. 大语言基础模型 3.1 大语言基础模型简介 3.2 分词器 3.3 嵌入向量 3.4 Transformer 3.5 基于Transformer的基础模型的类别 3.6 预训练数据集 3.7 缩放定律 3.8 计算最优模型 3.9 小结

  4. 显存和计算优化 4.1 显存容量挑战 4.2 数据类型和数值精度 4.3 量化 4.4 优化自注意力层 4.5 分布式GPU集群计算 4.6 基于AWS的分布式计算 4.7 小结

  5. 微调和评估 5.1 指令微调简介 5.2 指令数据集 5.3 指令微调的过程 5.4 评估 5.5 小结

  6. 参数高效微调 6.1 全量手调与PEFT 6.2 LoRA和QLoRA 6.3 目标模块和网络层 6.4 评估PEFT微调模型 6.5 小结

  7. 通过人类反馈进行强化学习微调 7.1 与人类价值观对齐 7.2 强化学习概述 7.3 自定义训练奖励模型 7.4 现有奖励模型:Meta危害性检测器模型 7.5 通过人类反馈进行强化学习微调 7.6 评估RLHF微调模型 7.7 小结

  8. 模型部署优化 8.1 模型推理优化 8.2 大型模型推理容器 8.3 AWS Inferentia:专为推理而打造的硬件 8.4 模型更新和部署策略 8.5 指标和监控 8.6 自动伸缩 8.7 小结

  9. 通过RAG和agent实现基于上下文推理的应用程序 9.1 大语言模型的局限性 9.2 RAG 9.3 文档加载和分块 9.4 检索数据和重新排序 9.5 提示增强 9.6 agent 9.7 小结

  10. 多模态基础模型 10.1 用例 10.2 多模态提示工程实践 10.3 图像生成和增强 10.4 图像补全、图像外部填充和depth - to - image 10.5 图像描述和视觉问答 10.6 模型评估 10.7 扩散模型架构 10.8 Stable Diffusion架构 10.9 Stable Diffusion XL架构 10.10 小结

  11. 通过Stable Diffusion进行受控生成和微调 11.1 ControlNet 11.2 微调 11.3 小结

  12. Amazon Bedrock:用于生成式AI的托管服务 12.1 Bedrock基础模型 12.2 Bedrock推理API 12.3 大语言模型推理API 12.4 通过Amazon Bedrock进行微调 12.5 通过Amazon Bedrock创建agent 12.6 多模态模型 12.7 数据隐私和网络安全 12.8 治理和监控 12.9 小结

三、三级读书目录

第一章:生成式AI用例、基础知识和项目生命周期

• 1.1 生成式AI用例和任务

• 1.2 基础模型和模型中心

• 1.3 生成式AI项目生命周期

• 1.4 AWS上的生成式AI

• 1.5 为什么选择基于AWS构建生成式AI

• 1.6 在AWS上构建生成式AI应用程序

• 1.7 小结

第二章:提示工程与上下文学习

• 2.1 提示与补全

• 2.2 token

• 2.3 提示工程

• 2.4 提示结构

• 2.5 通过少样本推理进行上下文学习

• 2.6 提示工程实践

• 2.7 推理配置参数

• 2.8 小结

第三章:大语言基础模型

• 3.1 大语言基础模型简介

• 3.2 分词器

• 3.3 嵌入向量

• 3.4 Transformer

• 3.5 基于Transformer的基础模型的类别

• 3.6 预训练数据集

• 3.7 缩放定律

• 3.8 计算最优模型

• 3.9 小结

通过阅读这本书,读者可以系统地了解生成式AI的理论和实践,掌握在AWS平台上进行生成式AI开发的关键技术和方法。