🎓 第 5 课进阶上下文工程
上下文工程
如何给AI提供恰到好处的背景信息,让回答更精准、更贴合场景
上下文工程
上下文(Context)是提示词中最容易被忽视但又极其关键的要素。它告诉 AI "你在什么场景下、为什么需要这个回答、这个回答将被如何使用"。
什么是好的上下文?
对比 %%CB0%%
上下文的五个维度
| 维度 | 要告诉AI什么 | 示例 |
|---|---|---|
| 场景 | 在什么情况下使用 | "这是给投资人看的商业计划书" |
| 受众 | 谁将阅读/使用这个输出 | "读者是没有任何技术背景的市场部同事" |
| 目标 | 希望达到什么效果 | "目的是说服CTO批准这个技术方案" |
| 背景 | 相关的已有的信息 | "以下是上次会议的纪要:[内容]" |
| 限制 | 有什么特殊条件 | "我们用的是AWS,预算每月不超过5000元" |
上下文的给出方式
1. 前置说明 在任务描述之前先交代背景: > "我们是一家刚完成A轮融资的SaaS公司,主打中小企业CRM市场。现在需要..."
2. 引用粘贴 将相关资料直接粘贴到提示词中: > "以下是我们产品的用户反馈汇总,请基于这些数据分析:[粘贴500条用户反馈]"
3. 示例驱动(Few-shot) 给出1-3个期望的输入-输出对: > "请按照以下风格的示例,把后面的句子也转换了。示例:输入'很高兴'→输出'欣喜若狂,仿佛整个世界都明亮了几分'。现在输入'很生气'→"
4. 渐进式构建 多轮对话中逐轮补充上下文: > 第1轮:设定基本角色和场景 > 第2轮:提供具体数据 > 第3轮:反馈+修正方向
上下文信息的量:多少是最优?
| 信息量 | 效果 | 风险 |
|---|---|---|
| 太少 | AI 靠猜测填补空白 | 回答泛泛、不贴场景 |
| 刚好 | AI 有足够信息精准回答 | —— |
| 太多 | AI 可能被无关信息干扰 | 稀释重点、超出上下文窗口 |
判断原则 %%CB0%%
上下文窗口管理
不同模型的上下文窗口(一次能处理的文本量)不同:
| 模型 | 上下文窗口 | 策略 |
|---|---|---|
| GPT-4 | 8K-128K tokens | 长文档可一次放入 |
| Claude | 100K-200K tokens | 最适合处理超长文本 |
| 国产模型 | 4K-32K tokens | 需精简上下文 |
长上下文处理技巧 %%CB0%%
下一步
掌握了上下文工程之后,接下来学习提示词优化方法——如何通过迭代让提示词越来越精准。