系列教程说明
这是「AI专家养成计划」系列教程的第36篇,共140篇。本系列从零基础出发,每天两篇(早课理论+晚课实践),用70天带你从AI小白成长为能独立使用和开发AI应用的实践者。
适合人群:对AI感兴趣但没有技术背景的学习者、想用AI提升工作效率的职场人、准备进入AI领域的转行者。
上篇回顾
上一篇我们学习了AI助理:全能管家,了解了三个核心概念:
- AI助理是能够理解自然语言、执行多步任务的智能助手,不只是聊天工具
- 任务编排是AI助理的核心能力——把复杂任务拆解为多个步骤自动执行
- 个人助理场景包括日程管理、邮件处理、信息整理等日常高频任务
今天我们进入AI工具实战的第一课,深入了解目前最流行的AI对话工具——ChatGPT。
什么是ChatGPT?
如果你只记一个关于AI工具的名字,那大概率就是ChatGPT。
2022年11月30日,OpenAI发布了ChatGPT。仅仅两个月,它的月活跃用户就突破了1亿,成为人类历史上增长最快的消费级应用。为什么它这么火?因为它第一次让普通人感受到了”和AI像人一样对话”是什么体验。
ChatGPT的本质是一个大语言模型(LLM)的对话界面。我们在Day06学过,大模型通过海量文本训练获得了语言理解和生成能力。ChatGPT把这个能力包装成了一个简单的聊天窗口——你打字,它回答,就像和一个知识渊博的朋友聊天。
但ChatGPT远不止”聊天”这么简单。它能做的事情包括:
- 写作:写邮件、写报告、写代码、写故事
- 分析:总结文档、分析数据、解释概念
- 推理:逻辑推理、数学计算、方案对比
- 创作:诗歌、剧本、广告文案
- 编程:写代码、调试、解释代码逻辑
- 翻译:100+语言互译
ChatGPT的模型演进
理解ChatGPT的版本演进,能帮你更好地选择和使用它。
GPT-3.5(2022.11)
ChatGPT最初使用的模型。速度快、免费可用,但推理能力和知识深度有限。适合日常闲聊和简单任务。
GPT-4(2023.03)
一次巨大的飞跃。推理能力显著提升,能处理更复杂的任务,比如多步数学推理、长文档分析。但速度较慢,需要付费使用。
GPT-4 Turbo(2023.11)
GPT-4的优化版本,支持128K上下文窗口(能一次读完一本小说),知识更新到2023年4月,价格更低。
GPT-4o(2024.05)
“o”代表”omni”(全能)。这是ChatGPT目前的主力模型,支持文本、图片、语音多模态输入,速度接近GPT-3.5但能力接近GPT-4。免费用户也能使用。
o1/o3系列(2024-2025)
专门针对复杂推理优化的模型。在数学、编程、科学推理等任务上远超普通GPT-4。特点是”先思考再回答”,会展示推理过程。
选择建议:
| 场景 | 推荐模型 |
|---|
|——|———-|
| 日常问答、闲聊 | GPT-4o(免费) |
|---|---|
| 写作、翻译 | GPT-4o |
| 复杂推理、编程 | o1/o3 |
| 长文档分析 | GPT-4 Turbo |
| 图片理解 | GPT-4o |
免费版 vs Plus版:怎么选?
ChatGPT有免费和付费两个版本,很多同学纠结要不要花钱。帮你算清楚这笔账:
免费版
- 使用GPT-4o mini(轻量版)
- 有限的GPT-4o使用次数
- 支持基本对话、文件上传、图片理解
- 够用场景:日常问答、简单写作、学习辅助
Plus版($20/月,约145元)
- GPT-4o无限使用
- 优先使用o1推理模型
- 支持DALL-E图片生成
- 支持高级数据分析(上传Excel自动分析)
- 支持GPTs(自定义AI助手)
- 支持联网搜索
- 值得场景:每天高频使用、需要图片生成、需要处理数据
Pro版($200/月)
- 所有模型无限使用
- 包括最强的o1 pro模式
- 适合:重度AI用户、开发者、研究人员
我的建议:先用免费版体验1-2周,如果每天都用、觉得限制太多,再升级Plus。大部分人的需求,免费版+GPT-4o已经能满足80%。
ChatGPT的核心使用技巧
很多人用ChatGPT只是随便聊几句,觉得”也就那样”。其实,会用和不会用,效果天差地别。这里分享5个让你效率翻倍的技巧:
技巧一:给ChatGPT一个角色
不要直接问问题,先告诉它”你是谁”。
`
你是一位资深的Python开发工程师,有10年经验。
请帮我审查以下代码,找出潜在的bug和性能问题。
`
角色设定能让ChatGPT的回答更专业、更有针对性。我们在Day09详细讲过这个技巧。
技巧二:提供上下文
ChatGPT不知道你的背景。信息给得越具体,回答越精准。
`
❌ “帮我写一封邮件”
✅ “我是一名项目经理,需要给客户写一封邮件,
说明项目延期2周的原因(技术团队发现了一个安全漏洞需要修复),
语气要专业但诚恳,300字左右”
`
技巧三:追问和迭代
第一次回答不满意?不要重新开对话,而是追问改进。
`
“这个方案不错,但能不能更简洁一些?”
“能不能用表格的形式重新整理?”
“请把第3点展开说说,加一个具体案例”
`
追问比重新提问高效得多,因为ChatGPT记住了前面的上下文。
技巧四:让ChatGPT”一步一步来”
对于复杂任务,加一句”请一步一步思考”(Let’s think step by step),效果会显著提升。这是我们在Day11学过的思维链技巧。
`
请一步一步分析这个商业计划的可行性:
- 先分析市场需求
- 再评估竞争格局
- 然后估算成本
- 最后给出综合建议
`
技巧五:用好系统指令
ChatGPT的”自定义指令”功能(Custom Instructions)可以设置全局偏好。在设置中填写:
- 你是谁:你的职业、背景
- 你希望AI怎样回答:语言风格、回答长度、是否需要举例
设置一次,所有对话都会自动应用,不用每次都重复说明。
ChatGPT的隐藏功能
除了基础对话,ChatGPT还有很多你可能不知道的强大功能:
文件分析
直接上传PDF、Word、Excel、图片,ChatGPT能读取内容并回答问题。
实用场景:
- 上传论文PDF,让它总结核心观点
- 上传Excel表格,让它分析数据趋势
- 上传代码截图,让它帮你debug
联网搜索
ChatGPT Plus用户可以联网搜索最新信息,不再受限于训练数据的截止日期。
GPTs商店
OpenAI的GPTs商店里有数百万个定制AI助手,覆盖各种场景:
- Canva:帮你设计图片
- Consensus:搜索学术论文
- Code Interpreter:运行Python代码
- Data Analyst:数据分析和可视化
你也可以创建自己的GPTs,不需要编程知识。
代码执行
ChatGPT内置了一个Python运行环境。你可以:
- 上传数据文件,让它写代码分析
- 让它生成图表和可视化
- 进行数学计算和统计分析
图片生成
集成DALL-E 3,直接在对话中生成图片。
`
生成一张未来城市的夜景图,赛博朋克风格,
霓虹灯倒映在雨水中
`
常见误区和避坑指南
误区一:ChatGPT说的都是对的
真相:ChatGPT会”一本正经地胡说八道”(AI幻觉)。它可能编造不存在的论文、虚构统计数据、给出错误的代码。
应对:重要信息一定要二次验证,特别是:
- 具体的数据和引用
- 代码是否能运行
- 法律、医学等专业建议
误区二:一个问题问到底
真相:如果一个问题很大,拆成小问题分别问,效果好得多。
`
❌ “帮我做一个完整的商业计划”
✅ 先问”帮我分析这个行业的市场规模”
再问”这个领域的主要竞争对手有哪些”
然后问”根据这些信息,帮我写一个营销策略”
`
误区三:对话越长越好
真相:对话太长会导致上下文丢失。ChatGPT有上下文窗口限制,太早的信息会被”遗忘”。
应对:重要结论及时保存,长任务分多个对话进行。
误区四:免费版就够了
真相:取决于你的使用频率和需求。如果你每天用ChatGPT工作2小时以上,Plus版的效率提升远超$20的价值。
实战案例:用ChatGPT完成一天的工作
让我用一个真实场景展示ChatGPT的深度使用:
场景:你是一名市场经理,需要准备一个产品发布会。
Step 1:头脑风暴
`
我要为一款智能手表做产品发布会,请帮我头脑风暴10个有创意的发布会主题,
要求:科技感强、能体现健康理念、适合年轻人
`
Step 2:写演讲稿
`
主题选定”腕上健康管家”,请帮我写一个5分钟的发布会开场演讲稿,
要点:1)智能手表市场趋势 2)我们产品的3个核心卖点 3)一个打动人的用户故事
`
Step 3:制作PPT大纲
`
请帮我设计一个20页的PPT大纲,包含:
- 封面和议程
- 市场分析(用数据说话)
- 产品介绍(每页一个功能亮点)
- 竞品对比
- 价格和上市计划
- 结尾和互动环节
`
Step 4:写新闻稿
`
基于以上信息,写一篇800字的产品发布新闻稿,
适合科技媒体发布,语言要专业但不枯燥
`
Step 5:准备Q&A
`
预测记者可能问的10个尖锐问题,并帮我准备回答,
特别是关于:价格竞争力、续航能力、与Apple Watch的区别
`
一个下午的工作量,用ChatGPT辅助可能只需要1-2小时。关键不是让AI替你工作,而是让它帮你更快地从0到1。
今日总结
三个关键要点:
- ChatGPT是一个大语言模型的对话界面,从GPT-3.5到o3,模型能力不断进化,GPT-4o是目前的主力模型
- 会用和不会用效果天差地别——角色设定、提供上下文、追问迭代、思维链、自定义指令是5个核心技巧
- ChatGPT不只是聊天工具——文件分析、联网搜索、GPTs商店、代码执行、图片生成都是强大功能
今日行动项
三个小任务,今天就可以试试:
- 注册并体验:如果还没有ChatGPT账号,今天去 chatgpt.com 注册一个(需要科学上网),用免费版体验5轮对话
- 设置自定义指令:在ChatGPT设置中填写”自定义指令”,告诉它你的职业和回答偏好
- 完成一个真实任务:用ChatGPT帮你完成一项实际工作——写一封邮件、总结一篇文章、或者分析一份数据
下篇预告
明天早上8点:Day37——Claude:Anthropic的对话AI
今天下午5点:Day36晚课——ChatGPT实战技巧
🚇 地铁深读:ChatGPT背后的技术革命
这个板块专为地铁通勤设计,每篇5-10分钟。不想深读可以跳过,不影响主线学习。
从GPT到ChatGPT:一个意外的成功
很多人不知道,ChatGPT的诞生其实是一个”意外”。
2022年初,OpenAI内部对GPT-3.5的定位还是一个”研究预览”。团队把它包装成聊天界面发布,主要是为了收集用户反馈,为GPT-4的开发做准备。
结果,发布后的反响远超所有人预期。服务器被挤爆,OpenAI不得不紧急扩容。两个月破亿用户的增长速度,让Instagram(2.5个月)和TikTok(9个月)都相形见绌。
这个”意外”背后有一个深刻的启示:技术的价值不在于它有多先进,而在于它能被多少人方便地使用。GPT-3的API早就可以用了,但只有开发者能用。ChatGPT把它变成了”人人都能用”的产品,才引爆了整个AI时代。
RLHF:让AI说”人话”
ChatGPT为什么比之前的AI模型更”会聊天”?秘密在于RLHF(基于人类反馈的强化学习)。
传统的语言模型只学会了”预测下一个词”,但不会判断哪个回答更好。RLHF的流程是:
- 收集人类偏好:让标注员对同一个问题的多个回答排序
- 训练奖励模型:学习人类的偏好模式
- 强化学习:用奖励模型指导语言模型生成更受欢迎的回答
这就像教一个学生写作文——不只教他语法,还要教他”什么是好文章”。RLHF让ChatGPT学会了人类的沟通方式,而不只是语言规律。
ChatGPT的”记忆”问题
你可能注意到,ChatGPT有时候会”忘记”你之前说过的话。这是因为上下文窗口的限制。
GPT-4o的上下文窗口是128K tokens(约10万个汉字),听起来很大,但如果你上传一份很长的文档+多轮对话,很快就满了。一旦满了,最早的内容就会被截断。
OpenAI后来推出了”Memory”功能,让ChatGPT记住跨对话的关键信息。但这和真正的”记忆”还有很大差距——它更像一个便签本,而不是大脑。
思考题
- ChatGPT的免费模式和付费模式,分别对应互联网行业的哪种商业模式?
- 为什么ChatGPT的竞争对手(Claude、Gemini、开源模型)始终无法完全取代它?
- 如果未来AI助手都像ChatGPT一样好用,”会用AI”还能算一项技能吗?什么才是真正的竞争优势?
推荐资源
- 📖 OpenAI Blog — 官方博客,了解最新功能和研究
- 📖 ChatGPT Prompt Engineering Guide — OpenAI官方提示词指南
- 📺 Andrej Karpathy: Intro to Large Language Models — 1小时LLM入门讲座
- 📺 3Blue1Brown: But what is a GPT? — 可视化讲解GPT原理
发表回复