Day12——晚课 少样本学习:给AI看例子

作者:

📚 AI专家养成计划 · 第24篇(共140篇)

⏱️ 阅读时间:正文10-15分钟 + 地铁深读5-10分钟

🎯 适合人群:刚学完少样本学习理论,想动手练一遍的你


上篇回顾:少样本学习的核心

今天早课我们学了少样本学习(Few-Shot Learning),核心就三件事:

1. 什么是少样本——不是让AI”学新知识”,而是用几个例子告诉AI你要什么格式、什么风格、什么逻辑。

2. 三种模式——零样本(直接问)、一样本(给一个例子)、多样本(给两三个例子)。例子越多,AI越准确。

3. 什么时候用——当你的需求很难用语言精确描述时,”举例”比”描述”更高效。

💡 早课教你知道”是什么”,晚课带你动手”做一遍”。今晚我们不讲理论,只做一件事:


练习一:零样本 vs 少样本,差多少?

我选了三个日常场景,让你亲身感受”给不给例子”的差距。

场景A:把口语改成书面语

零样本提问

请把下面这段话改成书面语:

“这个项目我觉得还行吧,就是进度有点慢,主要是人手不够,另外客户那边需求老改。”

AI可能会输出一段”中规中矩”的改写,但风格拿捏不准——有时太正式,有时又没变多少。

少样本提问

请把下面这段话改成书面语,参考示例的风格:

>

示例:

口语:”说实话这方案我觉得一般,主要是成本太高了。”

书面:”综合评估,该方案在可行性方面表现尚可,但成本控制存在较大压力。”

>

现在请改写:

“这个项目我觉得还行吧,就是进度有点慢,主要是人手不够,另外客户那边需求老改。”

AI会精准地模仿示例的风格:用”项目整体表现尚可”、”人力资源配置不足”、”客户需求存在频繁变更”这样的表述。

差别在哪? 零样本时AI在猜你要什么风格,少样本时AI直接看到了你想要的效果。一个在猜,一个在学。

场景B:把信息整理成表格

零样本提问

请帮我整理以下信息:

“小王是前端开发,3年经验,会React和Vue;小李是后端开发,5年经验,会Java和Go;小张是测试,2年经验,会Selenium和JMeter。”

AI可能会输出各种格式:列表、段落、或者格式奇怪的表格。

少样本提问

请把信息整理成表格,参考格式:

>

示例:

输入:”苹果,红色,5元一斤,很甜”

输出:

| 名称 | 颜色 | 价格 | 口感 |

|——|——|——|——|

| 苹果 | 红色 | 5元/斤 | 甜 |

>

现在请整理:

“小王是前端开发,3年经验,会React和Vue;小李是后端开发,5年经验,会Java和Go;小张是测试,2年经验,会Selenium和JMeter。”

AI会输出一个结构清晰的表格,包含”姓名、岗位、经验年限、技能栈”四列。

差别在哪? 你不需要描述”表格应该长什么样”——例子已经替你说清楚了。

场景C:生成特定格式的回复

零样本提问

客户说:”你们的软件经常崩溃,太差了!”请帮我写一封回复。

AI会写一封客服回复,但语气、长度、结构都不确定。

少样本提问

请按以下风格回复客户投诉,参考示例:

>

示例:

客户:”物流太慢了,等了一周还没到!”

回复:”非常抱歉给您带来了不便。我已为您查询了物流信息,目前包裹已到达您所在城市的配送中心,预计明天送达。如您有紧急需求,我可以为您安排优先处理。感谢您的耐心等待。”

>

现在请回复:

客户:”你们的软件经常崩溃,太差了!”

AI会模仿示例的结构:先道歉 → 再给出具体行动 → 最后感谢。语气一致,长度适中。

🔑 练习小结:少样本学习的精髓是——你不需要完美地描述需求,你只需要给出一个好例子。例子是浓缩的需求说明书。


练习二:设计你自己的”例子模板库”

现在轮到你了。做下面这件事:

第一步:找一个你经常用AI做的任务

比如:写邮件回复、生成产品描述、翻译技术文档、生成SQL查询、写测试用例……

第二步:准备2-3个高质量例子

每个例子包含”输入 → 输出”的配对。关键是:

  • 多样性:例子要覆盖不同的情况(简单/复杂、长/短、正式/随意)
  • 一致性:所有例子的输出风格必须统一,否则AI会困惑
  • 代表性:选最典型的场景,不要选边界case

第三步:拼成提示词模板

`

你是一位{角色}。

请根据以下示例,处理我的请求:

示例1:

输入:{输入A}

输出:{输出A}

示例2:

输入:{输入B}

输出:{输出B}

示例3:

输入:{输入C}

输出:{输出C}

现在请处理:

输入:{你的实际输入}

输出:

`

第四步:测试与迭代

用你的实际输入测试一次。如果结果不理想:

  • 风格不对 → 检查例子之间的风格是否一致
  • 格式不对 → 在例子中展示更明确的格式
  • 逻辑不对 → 增加一个”边缘case”的例子

我的经验:一个好的例子模板库,能让你日常80%的AI任务效率提升3倍以上。花一小时整理,省一百小时返工。


练习三:少样本 + 思维链 + 角色设定 三合一

前面学了角色设定(Day09)、结构化提示词(Day10)、思维链(Day11)、少样本(今天)。现在把四个技巧融合在一起。

场景:你是一位产品经理,需要AI帮你把客户需求转化成技术规格。

融合提示词

角色:你是一位资深产品经理,擅长将客户需求转化为技术团队可执行的规格说明。

>

任务:请将以下客户需求转化为技术规格文档。

>

示例1

需求:”客户希望登录更快一些。”

技术规格:

– 需求编号:REQ-001

– 需求描述:优化用户登录流程性能

– 验收标准:登录响应时间 ≤ 1秒(当前为3秒)

– 技术方案:引入Redis缓存Session,启用SSO单点登录

– 优先级:P1

– 预估工时:3人日

>

示例2

需求:”客户说报表数据不对。”

技术规格:

– 需求编号:REQ-002

– 需求描述:修复销售报表数据准确性问题

– 验收标准:报表数据与源系统100%一致

– 技术方案:排查ETL任务时区转换逻辑,修复数据聚合SQL

– 优先级:P0

– 预估工时:2人日

>

思考步骤

1. 先理解客户的原始意图(客户真正想要什么?)

2. 识别技术实现的关键点

3. 设定可量化的验收标准

4. 给出优先级和工时评估

>

现在请处理

需求:”客户想要在手机上也能审批报销单。”

看到了吗?角色设定了身份,例子展示了格式,思维链规定了推理步骤。四合一才是完整的提示词工程。


练习四:少样本常见陷阱

陷阱一:例子太少,以偏概全

只给1个例子,AI可能过度拟合这个例子的特征。

❌ 只给了一个”道歉邮件”的例子,AI以后每封邮件都道歉。

✅ 至少给2个例子,覆盖不同的情况。如果只能给1个,在提示词里补充一句:”这是格式参考,请根据实际情况调整内容。”

陷阱二:例子本身质量差

如果你给的例子有错误、有歧义、风格不一致,AI会照单全收。

❌ 例子A用”尊敬的先生”,例子B用”Hi哥们”——AI不知道该听谁的。

✅ 所有例子的风格、格式、语气必须统一。花时间打磨例子,回报巨大。

陷阱三:例子和任务不在一个”维度”

你给的例子是”翻译任务”,但实际请求是”摘要任务”。

❌ 示例:中英翻译…… 现在请帮我总结这篇文章。

✅ 例子和实际任务必须是同一类任务。如果你有多种任务类型,每种任务准备一个独立的模板库。

陷阱四:把例子当”标准答案”死记硬背

❌ “请严格按照示例的格式,一个字都不能改。”

这样做的结果是AI变成了”复印机”,遇到稍微不同的输入就出错。

✅ “请参考示例的风格和格式,根据实际内容灵活调整。”


课后作业

花15分钟做这件事:

  1. 选任务:找出你最常用AI做的一个任务
  2. 写例子:准备2个高质量的输入→输出例子
  3. 组装提示词:用今天的模板组装完整的少样本提示词
  4. 对比测试:先用零样本试一次,再用少样本试一次,把两个结果截图保存
  5. 存档:把这个提示词存到你的笔记里,以后直接复用

做完你会发现,好的例子比好的描述更值钱


🚇 地铁深读:少样本学习的进阶玩法

“动态例子”——让AI自己选最合适的例子

如果你有一个很大的例子库(比如20个例子),不可能全部塞进提示词。怎么办?

两步法:先让AI根据当前任务,从库中选出最相关的2-3个例子,然后再用这些例子处理任务。

我有一个包含以下示例的库:

[示例1:邮件回复-投诉] [示例2:邮件回复-咨询] [示例3:邮件回复-合作] …

>

现在的任务是:”客户说发票金额有误,请处理。”

请先从上面的示例库中选出与此任务最相关的2个示例,然后用它们来生成回复。

这本质上是RAG(检索增强生成)的简化版。先检索,再生成。

“反向少样本”——从结果倒推好例子

你拿到一个AI产出的高质量结果,想让以后的输出都达到这个水平?

方法:把这个好结果当作”例子”存入你的模板库。下次直接用它作为few-shot示例。

更进一步:让AI分析这个好结果”好在哪里”。

以下是一个优秀的{领域}输出。请分析:

1. 这个输出在结构上有什么特点?

2. 语言风格上有什么值得学习的?

3. 如果我要准备类似的示例,应该注意什么?

>

[粘贴好结果]

AI会告诉你:结构上用了”总-分-总”、语言上”专业术语搭配口语化解释”、”每个观点都配了数据支撑”……这些洞察就是你准备新例子的指导原则。

少样本 vs 微调:什么时候该升级?

少样本学习是”在提示词里教AI”,微调是”在模型层面教AI”。

用少样本就够了的场景

  • 任务模式固定(格式化、分类、翻译风格)
  • 例子数量 < 10
  • 需要经常调整规则

该考虑微调的场景

  • 例子数量 > 50,提示词太长
  • 需要学习领域专有知识
  • 对响应速度有要求(微调后的模型不需要读大量例子)

大多数日常场景,少样本学习就够了。微调是更重的武器,别轻易动用。

推荐阅读

  • 《Language Models are Few-Shot Learners》(OpenAI, 2020)——GPT-3的论文,首次系统展示了少样本学习的能力
  • OpenAI Prompt Engineering Guide(官方文档)——有大量few-shot的实际案例

不需要读论文全文,重点看论文中的Table 3和Figure 3,直观感受”给1个例子、3个例子、10个例子”的准确率变化曲线。


今日小结

今天晚课我们做了四件事:

  1. 三个场景对比——口语改写、信息整理、客服回复,感受少样本的威力
  2. 设计模板库——给自己最常用的AI任务准备2-3个高质量例子
  3. 四合一融合——角色 + 结构化 + 思维链 + 少样本,完整的提示词工程
  4. 避坑指南——四个常见陷阱和纠正方法

记住:你不需要完美地描述需求,你只需要给出一个好例子。


下篇预告

明天早上8点:Day13——提示词进阶:复杂任务拆解

前面学了角色设定、结构化、思维链、少样本,四个工具单独使用都很强。明天教你把复杂任务拆成多个子任务,让AI”分步走”、”分角色走”,应对真正复杂的需求。

明晚5点:Day13——晚课 复杂任务拆解实战


*作者:攀岩者,技术总监,19年 IT 全栈实战。精通网络、安全、云计算、容器、数据库、超算,持证 PMP、ITIL、CKA、网络工程师、信息安全等级保护、AIX 天工计划。主导过多个千万级政务与智慧城市项目,从售前到交付全流程打通。热衷开源,日拱一卒,每天分享 AI 学习笔记,陪你从零基础到 AI 达人。*

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注