在生产环境下的大语言模型(LLM)中,“格式化提示(format prompt)”包含以下几个关键要点:
提示的清晰性与明确性
- 清晰表述任务或问题:提示需要清楚地说明期望大语言模型去完成的任务或解答的问题。比如,不能只是模糊地说“给我讲讲某件事”,而应更具体地表述为“详细描述光合作用的过程”。
- 避免歧义:要是想让大语言模型生成故事,就要明确指定故事的类型(例如“写一篇关于时空旅行的科幻短篇小说”)、篇幅长度(比如“写一篇500字的故事”)以及其他相关细节,像目标受众(例如“为中学生写一篇关于英雄冒险的故事”)等内容。
针对大语言模型的输入格式化
- 遵循编码标准:在文本类大语言模型中,通常要采用像UTF-8这样定义明确的字符编码,以保证文本能被正确解读。
- 按特定格式组织:如果大语言模型是大型系统的一部分,且该系统以特定格式(如JSON)传递数据,那么提示就要格式化为相应的JSON对象。例如:
{
"task": "文本生成",
"parameters": {
"prompt": "生成一首关于大自然的诗歌",
"length": "10至15行"
}
}
- 处理多模态输入(若支持):有些大语言模型支持多种输入形式,比如能同时接收文本和结构化数据(如表格),这时提示就要清晰地区分并整理好这些不同类型的输入内容。
提示格式化的一致性
- 保持统一格式:当在生产环境中跨多个请求或者不同团队使用大语言模型时,提示采用统一格式至关重要。这有助于维持大语言模型响应的可预测性,也方便对系统进行调试和审查。
- 制定标准模板:可以针对不同类型的任务创建标准模板。例如,对于问答类大语言模型,模板可以是这样的:
{
"问题类型": ["事实性", "概念性", "程序性"],
"问题": "法国的首都是哪里?",
"背景信息": [可选,比如“这是用于地理知识小测验”之类的相关背景]
}
针对不同生产用例的提示工程
- 内容生成场景:在生成内容(像博客文章或产品描述)时,提示可能要包含特定关键词、语气要求以及目标平台等信息。例如“以友好且信息丰富的语气,为关注健康的受众写一篇300字左右关于素食饮食好处的博客文章”。
- 客户支持聊天机器人应用场景:提示可以被格式化为包含客户的疑问、其购买历史(如果有)以及当前支持阶段等内容。例如:
{
"客户疑问": "我的产品无法正常工作了,我该如何修理它?",
"购买历史": [
{"产品名称": "智能手机", "购买日期": "2024年1月1日"}
],
"支持阶段": "初次询问"
}