这是「AI专家养成计划」系列教程的第12篇,共140篇。
适合人群:AI零基础学习者,每天15-25分钟,从零到AI达人。
上篇回顾
Day11我们学了思维链(Chain-of-Thought),核心就三句话:
- 思维链 = 让AI把”怎么想的”说出来,而不是直接跳到答案
- 最简单的方式:在提示词末尾加”请一步步思考”
- 高级玩法:自己设计思考框架,引导AI按你的思路推理
还没消化的同学建议先回去翻翻Day11,今天的内容会用到这些基础。
一个你肯定经历过的场景
你有没有教过小孩写字?
你跟一个五岁的孩子说”写一个漂亮的’大’字”,他大概率会歪歪扭扭地画几笔。但如果你拿一张纸,先写一个标准的”大”字给他看,然后说”照着这个写”——他写出来的字,至少像那么回事了。
讲规则,不如给例子。
这个道理放在AI身上,同样成立。而且效果更明显。
今天我们要学的,就是一个被AI研究者称为”少样本学习”(Few-Shot Learning)的技巧。别被这个名字吓到——它本质上就是给AI看几个好例子,让它照着做。
什么是少样本学习?
先拆解一下这个名字:
- Few-Shot:少量样本,就是”给几个例子”
- Learning:学习,但这里AI并不是真的在”学习新知识”,更像是在”理解你的意图”
用一句大白话说:少样本学习 = 用例子代替说明书。
你不需要写一篇500字的需求文档告诉AI”我想要什么格式、什么风格、什么语气”,你只需要给它看两三个”正确答案”的样本,它就能举一反三。
这跟你教新员工是一模一样的。你不会给新来的人一本200页的SOP手册让他自己看——你会说”来,我先做一遍给你看,然后你照着做”。
三种模式:零样本、一样本、多样本
少样本学习有三种”档位”,就像汽车的手动挡一样,看情况切换:
零样本(Zero-Shot):不给任何例子,直接提要求。
帮我写一条朋友圈文案,推荐一家咖啡店。
AI会给你一个”还行”的结果,但风格全靠它自己猜。有时候太正式,有时候太随意,跟你的调性不一定对得上。
一样本(One-Shot):给一个例子,让AI照着来。
帮我写一条朋友圈文案,推荐一家咖啡店。
>
示例:
“周末的午后,躲进街角这家小咖啡馆,手冲耶加雪菲配上一块巴斯克蛋糕,窗外下着小雨,杯子里是整个夏天。📍城南·半日闲咖啡”
AI一看就懂了:哦,你要的是这种有画面感、有地点、有氛围的文案。它写出来的东西,风格就对味了。
多样本(Few-Shot):给两三个例子,AI理解得更精准。
帮我写一条朋友圈文案,推荐一家咖啡店。
>
示例1:
“周末的午后,躲进街角这家小咖啡馆,手冲耶加雪菲配上一块巴斯克蛋糕,窗外下着小雨,杯子里是整个夏天。📍城南·半日闲咖啡”
>
示例2:
“加班到凌晨,下楼转角遇到这家24小时营业的咖啡店。一杯美式下去,感觉自己又能再战三个小时。📍科技园·不打烊咖啡”
给了两个例子之后,AI不仅学到了”有画面感+地点”的格式,还学到了语气可以灵活——可以是悠闲的周末风,也可以是加班的打工人风。
为什么例子比描述更管用?
这个问题的答案,藏在AI的工作原理里。
你在Day04学过,AI是通过大量数据训练出来的。它的核心能力就是从模式中学习——看到足够多的输入-输出对,它就能推断出新输入应该对应什么输出。
少样本学习,本质上就是在提示词里临时构建几个输入-输出对,让AI从中提取模式。
这比你用文字描述需求高效得多,原因有三个:
第一,人类语言有歧义,例子没有。
你说”写得专业一点”,AI不知道你眼里的”专业”是什么——是学术论文那种严谨?还是商业报告那种简洁?还是律师函那种严肃?
但你给它看一个例子,它立刻就明白了。例子是最没有歧义的语言。
第二,例子同时传达了多个维度的信息。
一个例子可以同时告诉AI:格式(有emoji、有地址)、长度(50字左右)、语气(轻松亲切)、结构(先场景、再体验、最后推荐)。
你用文字描述这些维度,可能需要写200字。一个50字的例子就全搞定了。
第三,AI天生擅长模仿。
大语言模型在训练阶段看过海量的”范例对”,它的底层逻辑就是”看到A就输出B”。少样本提示词,恰好激活了它的这个本能。
怎么设计高质量的例子?
少样本学习的关键,不在于”给例子”,而在于”给好例子”。三个原则:
原则一:例子要多样。
如果你给的三个例子太相似,AI学到的模式就太窄。
比如你要AI帮你分类客户反馈,三个例子都是”好评”的,AI遇到差评就懵了。正确做法是:一个好评、一个差评、一个中性评价,让AI看到完整的模式谱系。
原则二:例子要简洁。
例子不是越长越好。太长的例子会让AI抓不住重点,也会浪费你的token。
一个好的例子,应该像一个标准答案——不多不少,刚好展示你要的格式和逻辑。
原则三:例子之间要有”一致性”。
如果你的三个例子风格差异太大——一个正式、一个搞笑、一个文言文——AI就困惑了:你到底要哪种?
例子之间应该保持核心特征一致,只在具体内容上有变化。就像老师给学生示范写字,每个字的笔画结构要一致,不能一个楷书一个草书。
实战:少样本学习的万能模板
给你一个可以直接拿去用的模板:
`
请[任务描述]。
示例1:
输入:[示例输入1]
输出:[示例输出1]
示例2:
输入:[示例输入2]
输出:[示例输出2]
示例3:
输入:[示例输入3]
输出:[示例输出3]
现在请处理:
输入:[你的实际输入]
`
举个具体例子。假设你要AI帮你把用户的口语反馈改成标准化的客服回复:
`
请根据用户的反馈,生成一段标准化的客服回复(语气亲切、有解决方案、不超过80字)。
示例1:
用户反馈:”你们这个App老是闪退,烦死了”
回复:”非常抱歉给您带来不好的体验!闪退问题可能与手机缓存有关,建议您先清理缓存后重新打开。如果问题持续,欢迎联系我们的技术支持团队,我们会第一时间帮您解决。”
示例2:
用户反馈:”新版本的界面好丑啊”
回复:”感谢您的反馈!新界面是我们基于大量用户调研做出的调整,可能需要一点适应期。如果您有具体的改进建议,非常欢迎您告诉我们,我们会认真参考。”
示例3:
用户反馈:”配送太慢了,等了一个星期”
回复:”非常理解您的焦急心情!配送延迟给您带来了不便,我们深感抱歉。已为您加急查询物流状态,预计1-2天内会有更新。如有问题请随时联系我们。”
现在请处理:
用户反馈:”买了你们的会员,结果好多功能还是要另外付费,感觉被坑了”
`
少样本 vs 思维链:什么时候用哪个?
在Day11你学了思维链,在Day12你学了少样本。这两个技巧不是互相替代的,而是互补的。
用思维链的场景:需要推理、分析、计算的时候。比如”分析这个方案的可行性”、”帮我算一下成本”。这类任务需要AI一步步展开逻辑。
用少样本的场景:需要模仿格式、风格、模式的时候。比如”帮我写这种风格的文案”、”帮我按这个格式整理数据”。这类任务需要AI”照葫芦画瓢”。
组合使用:最厉害的是把两个技巧叠加。先给例子(少样本),再要求AI展示推理过程(思维链)。
比如:
`
请分析以下用户评论的情感倾向(正面/负面/中性),并说明判断依据。
示例:
评论:”快递很快,包装也很好,下次还会买”
分析:正面。关键词”很快””很好””下次还会买”都表达满意。
结论:正面
现在请分析:
评论:”东西一般般吧,没什么惊喜但也没啥毛病”
`
少样本让AI知道”分析格式”,思维链让AI展示”判断逻辑”。两者结合,输出质量直接拉满。
一个容易踩的坑
有人觉得少样本就是”例子越多越好”,于是一口气给十个例子。
这是错的。
原因有两个:
第一,token有限。每个例子都占token,例子太多,留给AI思考和输出的空间就小了。一般2-5个例子是最优区间。
第二,例子太多反而模糊模式。你给3个例子,AI一眼看出共同特征。你给10个例子,AI可能在细枝末节上纠结,反而抓不住核心模式。
记住一个原则:例子是为了提炼模式,不是为了堆砌数量。 2个精心设计的例子,胜过10个随意拼凑的例子。
今日小结
今天讲了一个核心概念:少样本学习。三句话总结:
- 少样本 = 给AI看几个”正确答案”的样本,让它照着做
- 例子比描述更高效:无歧义、多维度、AI天生擅长模仿
- 好例子三原则:多样、简洁、一致
今天晚上5点,晚课会带你动手练一遍少样本学习——三个场景实操,让你感受”给不给例子”的巨大差距。
📖 地铁深读:Few-Shot Learning的前世今生
这个板块专为地铁通勤设计,每篇5-10分钟。不想深读可以跳过,不影响主线学习。
从机器学习到提示词工程:一个概念的演变
“Few-Shot Learning”这个词,最早出现在机器学习领域,指的是一种训练技术——让模型在只有少量标注数据的情况下也能学会新任务。
传统的机器学习需要成千上万条训练数据。比如训练一个猫狗分类器,你得准备几千张猫的照片和几千张狗的照片。但在现实中,很多场景根本拿不到那么多数据——医疗影像、罕见物种识别、小语种翻译……数据少得可怜。
2015年前后,研究者们开始探索元学习(Meta-Learning),也就是”学习如何学习”。核心思想是:模型先在大量任务上学会”怎么从少量例子中提取规律”,然后遇到新任务时,只需要几个例子就能快速适应。
Google在2020年发表的GPT-3论文中,首次展示了大语言模型的少样本能力。他们发现,一个足够大的语言模型,不需要任何额外训练,只需要在提示词里给几个例子,就能完成各种新任务。
这就是我们今天讲的”少样本提示词”——它不是一种训练技术,而是一种使用技巧。但底层原理是一样的:从少量例子中提取模式,然后泛化到新输入。
一个有趣的实验:3个例子 vs 1000条训练数据
2023年,斯坦福大学的研究团队做了一个有趣的对比实验。他们用两种方式让AI完成文本分类任务:
- 方式A:用1000条标注数据微调一个小模型
- 方式B:用GPT-3 + 3个少样本例子
结果让人大跌眼镜:方式B的准确率比方式A还高。
这个结果说明了一个深刻的道理:大模型在训练阶段已经”看过”了海量的人类知识,它已经具备了理解各种任务的能力。你不需要从头教它,只需要用几个例子”激活”它的能力。
这就是为什么少样本学习在大模型时代如此强大——你不是在教AI新知识,而是在唤醒它已有的能力。
思考题:少样本的边界在哪里?
想一个问题:少样本学习在什么情况下会失败?
比如:
- 如果你要AI完成一个全新的、它从未见过的任务类型呢?
- 如果你的例子本身就有错误呢?
- 如果你的例子互相矛盾呢?
留个悬念:Day13我们会讲”复杂任务拆解”——当一个任务太大、太复杂时,光靠例子不够,你需要把任务拆成小块。那时候你就能理解,少样本只是提示词工程的”一块拼图”,还有更多技巧等你解锁。
今日行动项
- 试一试:打开ChatGPT或任何AI对话工具,用零样本和少样本分别让它写一条朋友圈文案,对比效果
- 收集例子:把你工作中最常见的3个AI使用场景,每个场景准备1-2个”理想输出”的示例,存到一个文档里
- 组合练习:用少样本+思维链的组合方式,让AI分析一条商品评价的情感倾向
下篇预告
明天早上8点:Day13——提示词进阶:复杂任务拆解。当任务太大时,怎么把它拆成AI能处理的小块?
今晚5点:Day12——晚课 少样本学习实战。三个场景手把手练习,让你真正掌握”给AI看例子”的技巧。
*作者:攀岩者,技术总监,19年 IT 全栈实战。精通网络、安全、云计算、容器、数据库、超算,持证 PMP、ITIL、CKA、网络工程师、信息安全等级保护、AIX 天工计划。主导过多个千万级政务与智慧城市项目,从售前到交付全流程打通。热衷开源,日拱一卒,每天分享 AI 学习笔记,陪你从零基础到 AI 达人。*
发表回复