系列教程说明
这是「AI专家养成计划」系列教程的第3篇,共140篇。
本系列专为零基础学习者设计,从最简单的概念开始,逐步深入到AI开发实战。每天2篇,早上理论讲透,晚上动手实践,坚持70天,你就能从AI小白变成AI专家。
适合人群:对AI感兴趣但不知道从哪开始的任何人。
上篇回顾
昨天晚上,我们打开手机逐一验证了10个隐藏的AI功能——从输入法智能联想到垃圾短信拦截,从人脸解锁到短视频推荐。
三个核心要点:
- 你的手机就是一台AI终端——10个以上的核心功能都由AI驱动,你每天至少与50-100个AI模型交互
- AI的”三板斧”在生活中无处不在——识别、预测、优化,对应了你每天都在用的功能
- AI已经从”技术概念”变成了”日常工具”——就像电一样,你看不到它,但它无处不在
好,今天早上咱们换个角度。
昨天讲的是”AI是什么”,今天讲”AI怎么来的”。
你可能觉得AI是最近几年才冒出来的新东西。实际上,AI的历史比互联网还长。从1956年一群人在美国达特茅斯学院提出”人工智能”这个词,到2026年你用ChatGPT写代码,中间经历了整整70年。
这70年,AI经历了三次”寒冬”和三次”复兴”,就像一部跌宕起伏的连续剧。
今天,我用运维人最熟悉的方式——类比服务器的发展史——带你走一遍AI的进化之路。看完这篇,你会明白:为什么AI会在2023年突然爆发?为什么是ChatGPT而不是别的产品改变了世界?以及,2026年的AI技术格局到底长什么样。
第一章:1950年代——AI的”开机自检”阶段
图灵的那道”面试题”
1950年,一个叫艾伦·图灵的英国数学家发表了一篇论文,提出了一个至今仍在被讨论的问题:机器能思考吗?
为了回答这个问题,他设计了一个测试——现在叫”图灵测试”。
方法很简单:一个人通过文字跟两个对象聊天,一个是真人,一个是机器。如果这个人分不清哪个是机器,那就说明机器具备了”智能”。
这就像你运维值班时收到一条告警信息,如果光看文字内容你分不清是系统自动生成的还是同事手写的,那这个告警系统就算”够智能”了。
图灵测试到今天仍然有效。2025年,有研究显示GPT-4在特定场景下已经能通过图灵测试——70年前的”面试题”,AI终于答及格了。
达特茅斯会议:AI正式”命名”
1956年夏天,一群年轻科学家聚在美国达特茅斯学院开了一个暑期研讨会。会上,约翰·麦卡锡提出了一个新词——Artificial Intelligence(人工智能)。
这个会议就像创业公司的”第一次全体大会”。一群理想主义者坐在一起,画了一个巨大的饼:”我们要让机器像人一样思考。”
当时他们乐观地认为,一个暑假就能取得重大突破。结果呢?一个暑假过去了,什么都没搞出来。但这并不重要——重要的是,AI这个学科正式诞生了。
用运维的话说:1956年是AI的”系统初始化”阶段。内核加载了,但还没有任何服务跑起来。
第二章:1960-1970年代——AI的”黄金时代”与第一次寒冬
早期的AI有多厉害?
1960年代,AI研究者们确实做出了不少令人惊叹的东西:
ELIZA(1966年):世界上第一个聊天机器人。它能模拟心理治疗师跟你对话。你说”我很难过”,它会问”为什么难过呢?”。虽然它只是在做关键词匹配,但当时很多人真的以为自己在跟一个”有感情”的机器聊天。
这就像你写的第一个自动化运维脚本——功能很简陋,但第一次看到它自动执行的时候,那种震撼是真实的。
Shakey机器人(1966-1972年):斯坦福大学做的第一个能”看”和”动”的机器人。它能用摄像头观察环境,规划路径,避开障碍物。虽然现在看来慢得像蜗牛,但这是AI第一次把”感知”和”行动”结合在一起。
第一次AI寒冬(1970年代中期)
好景不长。到了1970年代中期,AI遭遇了第一次”寒冬”。
原因很简单:承诺太多,交付太少。
研究者们当初说”20年内机器能做任何人类能做的事”,结果十几年过去了,AI连翻译一段文字都翻不好。政府和军方开始削减资助,AI研究进入了低谷期。
用运维的视角看:这就像你承诺”自动化运维能让团队裁掉一半人”,结果自动化脚本三天两头出bug,老板一看——算了,还是招人靠谱。
核心教训:技术的价值不在于它”理论上能做什么”,而在于它”实际交付了什么”。这个教训,AI行业到今天还在反复学习。
第三章:1980年代——专家系统的”回光返照”
专家系统:AI的第一次商业化尝试
1980年代,AI找到了一个新的”卖点”——专家系统。
什么是专家系统?简单说,就是把某个领域专家的知识写成一堆”如果…那么…”的规则,让计算机按规则做判断。
比如医疗领域的MYCIN系统(其实1970年代就做了),它能根据症状诊断细菌感染,推荐抗生素。规则是这样的:
- 如果病人发烧 且 白细胞升高 且 培养出某种细菌 → 推荐使用某某抗生素
- 如果病人对青霉素过敏 → 排除某某方案
这就像你写的运维监控规则:
- 如果CPU使用率 > 90% 且 持续5分钟 → 发送告警
- 如果磁盘使用率 > 85% → 自动触发扩容
专家系统在商业上取得了巨大成功。很多大公司花重金购买,AI市场一度火爆。
第二次AI寒冬(1987-1993年)
但专家系统有一个致命问题:它不会学习,只会死记硬背。
你给它1000条规则,它能处理1000种情况。但第1001种情况出现了?它完全不知道该怎么办。而且维护这些规则的成本越来越高——每加一条新规则,都要确保它不会跟已有的规则冲突。
这就像一个监控系统有500条告警规则,改一条可能影响十条,维护起来噩梦一样。
1987年,市场崩盘,很多AI公司倒闭,第二次寒冬到来。
第四章:1990-2000年代——AI的”暗中发育”期
机器学习的崛起
虽然大众不再关注AI了,但研究者们没有停。这个时期最重要的突破是机器学习的兴起。
之前的做法是:人类写规则,机器执行规则。
机器学习的做法是:人类给数据,机器自己找规律。
这个转变有多重要?打个比方:
- 传统编程:你写一个脚本,规则是”如果邮件包含’中奖’、’免费’、’汇款’就标记为垃圾邮件”。结果呢?垃圾邮件改几个字就绕过去了。
- 机器学习:你给系统10万封已标记的垃圾邮件和正常邮件,让它自己学。它会发现人类想不到的规律——比如”凌晨3点发送的、包含大量感叹号的、发件人是数字组合的邮件,大概率是垃圾邮件”。
这个时期诞生了几个关键算法:
- 支持向量机(SVM):分类利器,至今仍在使用
- 随机森林:多个决策树投票,比单个决策树更准
- 神经网络:模仿大脑神经元连接的数学模型(后面会详细讲)
互联网带来的数据爆炸
1990-2000年代还有一个关键变化:互联网的普及带来了海量数据。
Google在1998年成立时,互联网已经有240万个网页。到2000年,这个数字增长到10亿。这些数据就像给AI提供了无穷无尽的”教材”。
用运维的话说:以前AI是”巧妇难为无米之炊”,现在数据管够了,就差算法和算力了。
第五章:2010年代——深度学习的”文艺复兴”
三个条件同时成熟
AI在2010年代迎来爆发,不是因为某一个天才的突破,而是三个条件同时成熟了:
1. 数据:互联网时代的红利
- ImageNet数据集:1400万张标注好的图片
- 维基百科、社交媒体、新闻网站提供了海量文本
- 移动互联网让数据采集成本几乎为零
2. 算力:GPU的意外助攻
- 原本为游戏设计的GPU(显卡),恰好擅长做神经网络需要的矩阵运算
- 一块2000块的显卡,算力相当于2000年的一台超级计算机
- 这就像你发现本来用来打游戏的电脑,跑起Docker来比服务器还快
3. 算法:深度学习的突破
- 2012年,AlexNet在ImageNet比赛中以压倒性优势获胜
- 深度神经网络证明了”层数越多,能力越强”
- 反向传播算法让训练深层网络成为可能
里程碑事件
2012年 – AlexNet:一个深度卷积神经网络在图像识别比赛中碾压所有传统方法。这是深度学习正式”出圈”的时刻。
2016年 – AlphaGo击败李世石:AI在围棋这个”人类智慧最后的堡垒”上战胜了世界冠军。全球直播,震撼了所有人。
这就像监控系统突然有一天告诉你:”我不仅能发现故障,还能在故障发生前30分钟预警,而且准确率99%。”你会从”这玩意儿靠谱吗?”变成”以后全靠它了”。
2017年 – Transformer论文发表:谷歌发表了那篇著名的论文《Attention is All You Need》。这篇论文提出了Transformer架构——这就是后来ChatGPT的核心技术。当时没几个人注意到它,但它改变了一切。
第六章:2020年代——大模型的”寒武纪大爆发”
GPT系列:从量变到质变
OpenAI从2018年开始发布GPT系列模型:
| 年份 | 模型 | 参数量 | 能力 |
|---|
|——|——|——–|——|
| 2018 | GPT-1 | 1.17亿 | 能写几句通顺的话 |
|---|---|---|---|
| 2019 | GPT-2 | 15亿 | 能写一段连贯的文章 |
| 2020 | GPT-3 | 1750亿 | 能写代码、翻译、问答 |
| 2022 | ChatGPT | 未公布 | 能像人一样对话 |
| 2023 | GPT-4 | 未公布 | 能看图、推理、写长文 |
| 2025 | GPT-4o/o3 | 未公布 | 推理能力接近人类专家 |
你注意到了吗?从GPT-1到GPT-3,参数量翻了1500倍。但真正让ChatGPT火遍全球的,不是参数量,而是用户体验的质变。
之前用AI需要写代码、调参数、懂技术。ChatGPT出来后,你只要会打字就能用AI。这就像从”Linux命令行操作服务器”变成了”点一下鼠标就完成部署”——门槛断崖式下降。
2023-2026年的AI格局
2023年ChatGPT引爆全球后,AI行业进入了”军备竞赛”阶段:
闭源阵营:
- OpenAI(GPT-4o、o3):领跑者,但速度放缓
- Anthropic(Claude):安全性最强,长文本处理最好
- Google(Gemini):多模态能力最强,搜索整合最好
开源阵营:
- Meta(Llama 3):开源霸主,社区最活跃
- 阿里(Qwen):中文最强开源模型
- DeepSeek:推理能力惊艳,性价比极高
中国的AI力量:
- 百度文心一言、阿里通义千问、字节豆包、Kimi、智谱……百花齐放
- 中文大模型的能力在2025年已经接近甚至部分超越GPT-4
用运维的话说:2023年之前,AI就像只有几家大公司能用的”私有云”;2023年之后,AI变成了人人可用的”公有云”。
第七章:AI发展史的三个规律
回顾70年的AI发展史,你会发现三个反复出现的规律:
规律一:AI的发展是”波浪式”的,不是线性的
AI经历了三次寒冬和三次复兴。每次寒冬都是因为过度承诺,每次复兴都是因为技术突破带来了真正可用的产品。
这就像服务器技术的发展——从大型机到PC服务器,从物理机到虚拟机,从虚拟机到容器,每次都有人说”旧技术要死了”,但实际上新技术是在旧技术的基础上长出来的。
规律二:数据、算力、算法缺一不可
1960年代有算法没数据,AI做不出东西。1990年代有数据有算法没算力,AI跑不动。2010年代三个条件同时成熟,AI才真正爆发。
这就像运维的”铁三角”——网络、计算、存储缺一个都不行。你有最好的服务器,但网络不通,什么都白搭。
规律三:AI的突破往往来自”意外”
- GPU本来是玩游戏用的,结果成了AI的核心算力
- Transformer本来是做翻译用的,结果成了ChatGPT的基础
- 强化学习本来是控制理论的东西,结果让AlphaGo打败了世界冠军
这就像Docker本来是做PaaS的,结果改变了整个运维行业。技术的走向,永远比你想象的更有趣。
今日总结:3个关键要点
- AI有70年历史,不是突然冒出来的——从1956年达特茅斯会议到2026年的ChatGPT,AI经历了三次寒冬和三次复兴,每次复兴都由真正的技术突破驱动
- AI爆发的三个条件:数据+算力+算法——2010年代这三个条件同时成熟,才有了今天的AI大爆发。GPU、互联网数据、深度学习算法缺一不可
- 2023年是AI的”iPhone时刻”——ChatGPT让AI从”技术圈的玩具”变成了”人人都能用的工具”,就像iPhone让智能手机从极客变成了大众
今日行动项
花5分钟完成这个小练习:
- 搜索:在搜索引擎搜索”1956年达特茅斯会议”,看看当年那群科学家长什么样——你会惊讶于AI的”创始人们”有多年轻
- 思考:你工作中有哪些”专家系统”式的做法?(比如固定的排查流程、写死的告警规则)它们是不是也可以用”机器学习”的方式升级?
- 分享:跟朋友聊一句”AI其实有70年历史了”,看看他们的反应——大多数人会很惊讶
📖 地铁深读:AI史上的那些”疯狂预言”
这个板块专为地铁通勤设计,每篇5-10分钟。不想深读可以跳过,不影响主线学习。
那些被打脸的AI预言
AI历史上,有太多”权威人士”做过后来被证明完全错误的预测。看看这些,你就会对当前的AI热潮多一份冷静。
1965年,AI先驱赫伯特·西蒙预言:”20年内,机器将能做任何人类能做的事。”
→ 结果:20年后是1985年,AI正在经历第二次寒冬。
1970年,AI研究者马文·明斯基预言:”3-8年内,我们将拥有一个具有普通人一般智力的机器。”
→ 结果:半个世纪过去了,我们有了ChatGPT,但它仍然会在简单逻辑题上犯错。
2004年,认知科学家史蒂芬·平克说:”AI永远无法理解语言的真正含义。”
→ 结果:2023年,GPT-4通过了律师资格考试的前10%。
那些被低估的AI突破
反过来,很多真正的突破在当时却被忽视了:
2012年,AlexNet赢得了ImageNet比赛。当时只有计算机视觉圈的人关注。但回头看,这是深度学习革命的”第一枪”。
2017年,谷歌发表了Transformer论文。论文标题《Attention is All You Need》霸气十足,但当时引用量很低。6年后,它成了ChatGPT、Claude、Gemini的共同基础。
2020年,OpenAI发布GPT-3。当时很多AI研究者说”这不过是个更大的语言模型”。2年后,基于GPT-3.5的ChatGPT改变了世界。
一个有趣的对比
| 时间 | AI的”硬件” | 类比 |
|---|
|——|————|——|
| 1960年代 | 大型机(百万美元一台) | 只有国家能搞AI |
|---|---|---|
| 1990年代 | 工作站(几万美元) | 大学和企业能搞AI |
| 2010年代 | GPU集群(几千美元) | 创业公司能搞AI |
| 2020年代 | 你的笔记本电脑 | 每个人都能用AI |
AI的门槛在不断降低。2026年的今天,你甚至可以在自己的笔记本电脑上运行一个开源大模型——这在10年前是不可想象的。
深度思考题
想一个问题:AI的下一次”寒冬”会来吗?
有人说不会,因为AI已经找到了真正的商业化路径(不像1970年代只有政府资助)。也有人说会,因为当前的AI投资热潮有泡沫成分(很多公司在烧钱没有盈利)。
我的看法是:即使有泡沫破裂,AI也不会像前两次寒冬那样”消失”。原因很简单——这次AI已经深入到了普通人的日常生活中。你可以砍掉一个实验室的经费,但你没法让10亿人停止使用手机上的AI功能。
这是AI历史上第一次,寒冬来了也不会真正冷下去。
与今天的主题相关的最新动态
2026年5月最新:
- OpenAI宣布GPT-5开发中:据报道,GPT-5将具备更强的推理能力和更长的上下文窗口。这是从GPT-4到GPT-5的又一次”参数量跃迁”。
- 开源模型持续追赶:Llama 4和Qwen 3系列在多项基准测试上已经接近甚至超越GPT-4。开源和闭源的差距在快速缩小。
- AI Agent成为新战场:2026年最大的AI趋势不是更大的模型,而是更”能干”的Agent。各大公司都在让AI从”回答问题”进化到”帮你做事”——这也是我们课程后面会重点讲的内容。
下篇预告
明天早上8点:数据——AI的粮食!为什么说”数据为王”。你会理解为什么同样的算法,用不同的数据训练出来效果天差地别。
今晚5点:2026年AI格局全景图——哪些技术正在改变世界。带你看清当前AI技术的全貌,知道哪些是真正值得关注的方向。
系列课程:AI专家养成计划 70天140篇
适合人群:零基础、对AI感兴趣的任何人
互动:有问题欢迎在评论区留言,我会一一回复
发表回复