📚 AI专家养成计划 · 第5篇(共140篇)
⏱️ 阅读时间:10-15分钟
🎯 适合人群:零基础,想要亲手训练一个AI模型的你
☀️ 早课回顾:3个核心要点
今天的早课我们聊了”模型”——AI的大脑。这里快速回顾一下关键概念:
1. 模型 = 训练好的算法 + 数据
算法是菜谱,数据是食材,模型就是做好的菜。训练的过程就是”照着菜谱反复练习,直到做出稳定好吃的菜”。
2. 模型的两个阶段:训练和推理
训练(Training)是学习阶段,需要大量数据和时间;推理(Inference)是工作阶段,给新数据就能快速出结果。就像学生上课学习 vs 毕业后工作。
3. 模型文件的本质是一堆数字
一个训练好的模型,本质上就是大量的参数(数字权重)。GPT-4可能有上万亿个参数,而一个简单的图像分类模型可能只有几百万个参数。
💡 核心理解:模型不是魔法,它就是”从数据中学到的经验”的数字化表达。
🎬 今晚实战:用Teachable Machine零代码训练AI
好了,理论听够了!今晚我们来真的动手。
我们要用Google出品的 Teachable Machine ——一个完全免费、零代码、浏览器里就能用的AI训练工具——来训练一个属于你自己的AI模型。
今晚你会学到:
- 用摄像头收集训练数据
- 一键训练一个图像分类模型
- 实时测试你的AI效果
- 导出模型用于其他项目
📦 第一步:打开Teachable Machine
- 打开浏览器(推荐Chrome),访问:
👉 https://teachablemachine.withgoogle.com/
(此工具需要科学上网访问)
- 点击 “Get Started” 按钮
- 你会看到三个选项:
- Image Project(图像项目)← 我们选这个
- Audio Project(音频项目)
- Pose Project(姿势项目)
- 点击 “Image Project”
进入后你会看到一个简洁的界面,左边是数据收集区,右边是预览区。
📸 第二步:收集训练数据
这一步是最关键的——AI需要你”喂”给它数据才能学习。
我们来做一个简单的分类任务:识别你的不同手势。
创建Class(类别)
- 你会看到默认有两个类别:Class 1 和 Class 2
- 把 Class 1 改名为 “竖起大拇指” 👍
- 把 Class 2 改名为 “比心” 🤟
- 点击 “Add a class” 添加第三个类别,命名为 “剪刀手” ✌️
录入图像
- 点击 “Webcam” 按钮(允许浏览器使用摄像头)
- 把手做出”竖起大拇指”的姿势
- 按住 “Hold to Record” 按钮,保持3-5秒,让摄像头拍下约30-50张照片
- 换个角度、换个距离再录一次——这是关键!
⚠️ 重要提醒:每个类别至少录100张以上,角度越多样,模型越聪明!
- 对”比心”和”剪刀手”重复同样的步骤
没有摄像头怎么办?
别担心!你也可以用上传图片的方式:
- 从手机拍几张手势照片
- 传到电脑上
- 点击 “Upload” 按钮上传
🧪 第三步:训练模型
数据收集好了?激动人心的时刻来了!
- 点击页面上方的 “Train Model” 按钮
- 等待训练完成(通常只需要30秒到2分钟)
- 训练过程中你会看到一个进度条,耐心等待
🤔 你可能会想:”就这样?不需要写代码?不需要配GPU?”
是的,就这样!Teachable Machine帮你处理了所有底层技术:神经网络搭建、反向传播、梯度下降……你只需要提供数据。
训练完成后,右侧预览区会自动激活摄像头实时预览。
🎯 第四步:测试你的AI
现在来检验成果!
- 在摄像头前做出竖起大拇指的手势
- 看!右侧面板会显示 “竖起大拇指” 的概率非常高(接近100%)
- 换成比心手势
- 概率分布会跟着变化,”比心”的柱子最高
- 试试剪刀手
- 你的AI应该能正确识别!
- 做一个它没见过的手势(比如握拳)
- 观察AI的反应——它会”困惑”,三个类别的概率都不高
🎉 恭喜!你刚刚训练了人生中第一个AI模型!
虽然这是一个很小的模型,但它包含了AI的核心流程:
- 数据收集 → 你录的手势照片
- 模型训练 → Google帮你完成的神经网络训练
- 推理预测 → 实时识别新手势
💾 第五步:导出你的模型
训练好的模型可以导出使用!
- 点击 “Export Model” 按钮
- 你会看到三个选项:
- TensorFlow.js —— 可以在网页中使用
- TensorFlow Lite —— 可以在手机App中使用
- TensorFlow —— 可以在Python项目中使用
- 选择 TensorFlow.js,点击 “Upload my model”
- 你会得到一个链接,可以在任何网页中嵌入这个模型!
🚀 进阶挑战:试试其他项目类型
如果你还有时间,可以探索Teachable Machine的其他能力:
音频分类
- 录制不同的声音(拍手、弹舌、敲桌子)
- 训练一个声音识别模型
姿势识别
- 用摄像头录制不同的身体姿势
- 训练一个姿势分类模型(比如:站立、坐下、举手)
📖 地铁深读:Teachable Machine背后的原理
它到底用了什么技术?
Teachable Machine 底层使用的是 迁移学习(Transfer Learning)。
还记得Day3晚课我们提到的迁移学习吗?核心思路是:
`
已有模型(见过100万张图片)
↓
只训练最后几层(你的手势图片)
↓
快速得到一个新模型
`
具体来说,它使用了一个预训练好的 MobileNet 模型作为基础:
- MobileNet 已经学会了识别”边缘、纹理、形状”等基础特征
- 你只需要教它:”这种特征组合 = 大拇指,那种 = 比心”
- 所以只需要很少的数据和很短的时间
为什么这很重要?
这个技术叫做 Few-Shot Learning(少样本学习) 的一种简化形式。它告诉我们一个深刻的道理:
🧠 AI训练不需要从零开始。站在巨人肩膀上,用少量数据就能解决特定问题。
这就是为什么2026年的AI应用如此爆发——基础模型越来越强大,定制化成本越来越低。
和”正经”AI训练的区别
| 对比项 | Teachable Machine | 正经AI训练 |
|---|
|——–|——————-|———–|
| 代码量 | 0行 | 数百到数千行 |
|---|---|---|
| 数据量 | 几十到几百张 | 几千到几百万张 |
| 训练时间 | 30秒~2分钟 | 几小时到几天 |
| 硬件要求 | 浏览器即可 | 需要GPU |
| 适用场景 | 原型验证、学习 | 生产环境 |
Teachable Machine 是学习和验证想法的绝佳工具,但要做出真正能用的AI产品,我们后面会学更专业的工具(PyTorch、HuggingFace等)。
✅ 今日总结
3个关键要点:
- 模型训练的核心流程是”数据→训练→推理”,Teachable Machine 让你零代码体验了这个完整流程
- 迁移学习是AI民主化的关键——站在预训练模型的肩膀上,少量数据就能定制专属AI
- 数据质量决定模型质量——多角度、多样化的训练数据,比单纯增加数量更重要
📝 今日行动项
- [ ] 打开 Teachable Machine,用摄像头训练一个至少3类的图像分类模型
- [ ] 测试模型对”没见过的数据”的表现,记录准确率
- [ ] 思考:你日常生活中有哪些场景可以用类似的方式训练AI?(提示:识别不同品牌的饮料、区分不同人的笔迹……)
📅 下篇预告
明天早课 Day06:机器学习vs深度学习——大圈套小圈,一次讲清楚
机器学习和深度学习到底什么关系?为什么深度学习突然火了?用一张图帮你彻底搞明白。
明天晚课 Day06:传统编程vs AI编程——思维方式的革命性转变
从”写规则”到”给数据”,编程思维的范式转换。用一个对比实验,让你体会AI编程的威力。
🎓 晚课合集 | 每天下午5点更新
💡 学完记得打卡!在评论区分享你训练的AI识别了什么有趣的东西
🔖 本文已收录至「AI专家养成计划·晚课实践」合集(album_id: 4522393809204510724)
发表回复