Day02——早课 AI的前世今生：从图灵到ChatGPT，60年进化史

系列教程说明

这是「AI专家养成计划」系列教程的第3篇，共140篇。

本系列专为零基础学习者设计，从最简单的概念开始，逐步深入到AI开发实战。每天2篇，早上理论讲透，晚上动手实践，坚持70天，你就能从AI小白变成AI专家。

适合人群：对AI感兴趣但不知道从哪开始的任何人。

上篇回顾

昨天晚上，我们打开手机逐一验证了10个隐藏的AI功能——从输入法智能联想到垃圾短信拦截，从人脸解锁到短视频推荐。

三个核心要点：

你的手机就是一台AI终端——10个以上的核心功能都由AI驱动，你每天至少与50-100个AI模型交互
AI的”三板斧”在生活中无处不在——识别、预测、优化，对应了你每天都在用的功能
AI已经从”技术概念”变成了”日常工具”——就像电一样，你看不到它，但它无处不在

好，今天早上咱们换个角度。

昨天讲的是”AI是什么”，今天讲”AI怎么来的”。

你可能觉得AI是最近几年才冒出来的新东西。实际上，AI的历史比互联网还长。从1956年一群人在美国达特茅斯学院提出”人工智能”这个词，到2026年你用ChatGPT写代码，中间经历了整整70年。

这70年，AI经历了三次”寒冬”和三次”复兴”，就像一部跌宕起伏的连续剧。

今天，我用运维人最熟悉的方式——类比服务器的发展史——带你走一遍AI的进化之路。看完这篇，你会明白：为什么AI会在2023年突然爆发？为什么是ChatGPT而不是别的产品改变了世界？以及，2026年的AI技术格局到底长什么样。

第一章：1950年代——AI的”开机自检”阶段

图灵的那道”面试题”

1950年，一个叫艾伦·图灵的英国数学家发表了一篇论文，提出了一个至今仍在被讨论的问题：机器能思考吗？

为了回答这个问题，他设计了一个测试——现在叫”图灵测试”。

方法很简单：一个人通过文字跟两个对象聊天，一个是真人，一个是机器。如果这个人分不清哪个是机器，那就说明机器具备了”智能”。

这就像你运维值班时收到一条告警信息，如果光看文字内容你分不清是系统自动生成的还是同事手写的，那这个告警系统就算”够智能”了。

图灵测试到今天仍然有效。2025年，有研究显示GPT-4在特定场景下已经能通过图灵测试——70年前的”面试题”，AI终于答及格了。

达特茅斯会议：AI正式”命名”

1956年夏天，一群年轻科学家聚在美国达特茅斯学院开了一个暑期研讨会。会上，约翰·麦卡锡提出了一个新词——Artificial Intelligence（人工智能）。

这个会议就像创业公司的”第一次全体大会”。一群理想主义者坐在一起，画了一个巨大的饼：”我们要让机器像人一样思考。”

当时他们乐观地认为，一个暑假就能取得重大突破。结果呢？一个暑假过去了，什么都没搞出来。但这并不重要——重要的是，AI这个学科正式诞生了。

用运维的话说：1956年是AI的”系统初始化”阶段。内核加载了，但还没有任何服务跑起来。

第二章：1960-1970年代——AI的”黄金时代”与第一次寒冬

早期的AI有多厉害？

1960年代，AI研究者们确实做出了不少令人惊叹的东西：

ELIZA（1966年）：世界上第一个聊天机器人。它能模拟心理治疗师跟你对话。你说”我很难过”，它会问”为什么难过呢？”。虽然它只是在做关键词匹配，但当时很多人真的以为自己在跟一个”有感情”的机器聊天。

这就像你写的第一个自动化运维脚本——功能很简陋，但第一次看到它自动执行的时候，那种震撼是真实的。

Shakey机器人（1966-1972年）：斯坦福大学做的第一个能”看”和”动”的机器人。它能用摄像头观察环境，规划路径，避开障碍物。虽然现在看来慢得像蜗牛，但这是AI第一次把”感知”和”行动”结合在一起。

第一次AI寒冬（1970年代中期）

好景不长。到了1970年代中期，AI遭遇了第一次”寒冬”。

原因很简单：承诺太多，交付太少。

研究者们当初说”20年内机器能做任何人类能做的事”，结果十几年过去了，AI连翻译一段文字都翻不好。政府和军方开始削减资助，AI研究进入了低谷期。

用运维的视角看：这就像你承诺”自动化运维能让团队裁掉一半人”，结果自动化脚本三天两头出bug，老板一看——算了，还是招人靠谱。

核心教训：技术的价值不在于它”理论上能做什么”，而在于它”实际交付了什么”。这个教训，AI行业到今天还在反复学习。

第三章：1980年代——专家系统的”回光返照”

专家系统：AI的第一次商业化尝试

1980年代，AI找到了一个新的”卖点”——专家系统。

什么是专家系统？简单说，就是把某个领域专家的知识写成一堆”如果…那么…”的规则，让计算机按规则做判断。

比如医疗领域的MYCIN系统（其实1970年代就做了），它能根据症状诊断细菌感染，推荐抗生素。规则是这样的：

如果病人发烧且白细胞升高且培养出某种细菌 → 推荐使用某某抗生素
如果病人对青霉素过敏 → 排除某某方案

这就像你写的运维监控规则：

如果CPU使用率 > 90% 且持续5分钟 → 发送告警
如果磁盘使用率 > 85% → 自动触发扩容

专家系统在商业上取得了巨大成功。很多大公司花重金购买，AI市场一度火爆。

第二次AI寒冬（1987-1993年）

但专家系统有一个致命问题：它不会学习，只会死记硬背。

你给它1000条规则，它能处理1000种情况。但第1001种情况出现了？它完全不知道该怎么办。而且维护这些规则的成本越来越高——每加一条新规则，都要确保它不会跟已有的规则冲突。

这就像一个监控系统有500条告警规则，改一条可能影响十条，维护起来噩梦一样。

1987年，市场崩盘，很多AI公司倒闭，第二次寒冬到来。

第四章：1990-2000年代——AI的”暗中发育”期

机器学习的崛起

虽然大众不再关注AI了，但研究者们没有停。这个时期最重要的突破是机器学习的兴起。

之前的做法是：人类写规则，机器执行规则。

机器学习的做法是：人类给数据，机器自己找规律。

这个转变有多重要？打个比方：

传统编程：你写一个脚本，规则是”如果邮件包含’中奖’、’免费’、’汇款’就标记为垃圾邮件”。结果呢？垃圾邮件改几个字就绕过去了。
机器学习：你给系统10万封已标记的垃圾邮件和正常邮件，让它自己学。它会发现人类想不到的规律——比如”凌晨3点发送的、包含大量感叹号的、发件人是数字组合的邮件，大概率是垃圾邮件”。

这个时期诞生了几个关键算法：

支持向量机（SVM）：分类利器，至今仍在使用
随机森林：多个决策树投票，比单个决策树更准
神经网络：模仿大脑神经元连接的数学模型（后面会详细讲）

互联网带来的数据爆炸

1990-2000年代还有一个关键变化：互联网的普及带来了海量数据。

Google在1998年成立时，互联网已经有240万个网页。到2000年，这个数字增长到10亿。这些数据就像给AI提供了无穷无尽的”教材”。

用运维的话说：以前AI是”巧妇难为无米之炊”，现在数据管够了，就差算法和算力了。

第五章：2010年代——深度学习的”文艺复兴”

三个条件同时成熟

AI在2010年代迎来爆发，不是因为某一个天才的突破，而是三个条件同时成熟了：

1. 数据：互联网时代的红利

ImageNet数据集：1400万张标注好的图片
维基百科、社交媒体、新闻网站提供了海量文本
移动互联网让数据采集成本几乎为零

2. 算力：GPU的意外助攻

原本为游戏设计的GPU（显卡），恰好擅长做神经网络需要的矩阵运算
一块2000块的显卡，算力相当于2000年的一台超级计算机
这就像你发现本来用来打游戏的电脑，跑起Docker来比服务器还快

3. 算法：深度学习的突破

2012年，AlexNet在ImageNet比赛中以压倒性优势获胜
深度神经网络证明了”层数越多，能力越强”
反向传播算法让训练深层网络成为可能

里程碑事件

2012年 – AlexNet：一个深度卷积神经网络在图像识别比赛中碾压所有传统方法。这是深度学习正式”出圈”的时刻。

2016年 – AlphaGo击败李世石：AI在围棋这个”人类智慧最后的堡垒”上战胜了世界冠军。全球直播，震撼了所有人。

这就像监控系统突然有一天告诉你：”我不仅能发现故障，还能在故障发生前30分钟预警，而且准确率99%。”你会从”这玩意儿靠谱吗？”变成”以后全靠它了”。

2017年 – Transformer论文发表：谷歌发表了那篇著名的论文《Attention is All You Need》。这篇论文提出了Transformer架构——这就是后来ChatGPT的核心技术。当时没几个人注意到它，但它改变了一切。

第六章：2020年代——大模型的”寒武纪大爆发”

GPT系列：从量变到质变

OpenAI从2018年开始发布GPT系列模型：

年份	模型	参数量	能力

|——|——|——–|——|

2018	GPT-1	1.17亿	能写几句通顺的话
2019	GPT-2	15亿	能写一段连贯的文章
2020	GPT-3	1750亿	能写代码、翻译、问答
2022	ChatGPT	未公布	能像人一样对话
2023	GPT-4	未公布	能看图、推理、写长文
2025	GPT-4o/o3	未公布	推理能力接近人类专家

你注意到了吗？从GPT-1到GPT-3，参数量翻了1500倍。但真正让ChatGPT火遍全球的，不是参数量，而是用户体验的质变。

之前用AI需要写代码、调参数、懂技术。ChatGPT出来后，你只要会打字就能用AI。这就像从”Linux命令行操作服务器”变成了”点一下鼠标就完成部署”——门槛断崖式下降。

2023-2026年的AI格局

2023年ChatGPT引爆全球后，AI行业进入了”军备竞赛”阶段：

闭源阵营：

OpenAI（GPT-4o、o3）：领跑者，但速度放缓
Anthropic（Claude）：安全性最强，长文本处理最好
Google（Gemini）：多模态能力最强，搜索整合最好

开源阵营：

Meta（Llama 3）：开源霸主，社区最活跃
阿里（Qwen）：中文最强开源模型
DeepSeek：推理能力惊艳，性价比极高

中国的AI力量：

百度文心一言、阿里通义千问、字节豆包、Kimi、智谱……百花齐放
中文大模型的能力在2025年已经接近甚至部分超越GPT-4

用运维的话说：2023年之前，AI就像只有几家大公司能用的”私有云”；2023年之后，AI变成了人人可用的”公有云”。

第七章：AI发展史的三个规律

回顾70年的AI发展史，你会发现三个反复出现的规律：

规律一：AI的发展是”波浪式”的，不是线性的

AI经历了三次寒冬和三次复兴。每次寒冬都是因为过度承诺，每次复兴都是因为技术突破带来了真正可用的产品。

这就像服务器技术的发展——从大型机到PC服务器，从物理机到虚拟机，从虚拟机到容器，每次都有人说”旧技术要死了”，但实际上新技术是在旧技术的基础上长出来的。

规律二：数据、算力、算法缺一不可

1960年代有算法没数据，AI做不出东西。1990年代有数据有算法没算力，AI跑不动。2010年代三个条件同时成熟，AI才真正爆发。

这就像运维的”铁三角”——网络、计算、存储缺一个都不行。你有最好的服务器，但网络不通，什么都白搭。

规律三：AI的突破往往来自”意外”

GPU本来是玩游戏用的，结果成了AI的核心算力
Transformer本来是做翻译用的，结果成了ChatGPT的基础
强化学习本来是控制理论的东西，结果让AlphaGo打败了世界冠军

这就像Docker本来是做PaaS的，结果改变了整个运维行业。技术的走向，永远比你想象的更有趣。

今日总结：3个关键要点

AI有70年历史，不是突然冒出来的——从1956年达特茅斯会议到2026年的ChatGPT，AI经历了三次寒冬和三次复兴，每次复兴都由真正的技术突破驱动

AI爆发的三个条件：数据+算力+算法——2010年代这三个条件同时成熟，才有了今天的AI大爆发。GPU、互联网数据、深度学习算法缺一不可

2023年是AI的”iPhone时刻”——ChatGPT让AI从”技术圈的玩具”变成了”人人都能用的工具”，就像iPhone让智能手机从极客变成了大众

今日行动项

花5分钟完成这个小练习：

搜索：在搜索引擎搜索”1956年达特茅斯会议”，看看当年那群科学家长什么样——你会惊讶于AI的”创始人们”有多年轻

思考：你工作中有哪些”专家系统”式的做法？（比如固定的排查流程、写死的告警规则）它们是不是也可以用”机器学习”的方式升级？

分享：跟朋友聊一句”AI其实有70年历史了”，看看他们的反应——大多数人会很惊讶

📖 地铁深读：AI史上的那些”疯狂预言”

这个板块专为地铁通勤设计，每篇5-10分钟。不想深读可以跳过，不影响主线学习。

那些被打脸的AI预言

AI历史上，有太多”权威人士”做过后来被证明完全错误的预测。看看这些，你就会对当前的AI热潮多一份冷静。

1965年，AI先驱赫伯特·西蒙预言：”20年内，机器将能做任何人类能做的事。”

→ 结果：20年后是1985年，AI正在经历第二次寒冬。

1970年，AI研究者马文·明斯基预言：”3-8年内，我们将拥有一个具有普通人一般智力的机器。”

→ 结果：半个世纪过去了，我们有了ChatGPT，但它仍然会在简单逻辑题上犯错。

2004年，认知科学家史蒂芬·平克说：”AI永远无法理解语言的真正含义。”

→ 结果：2023年，GPT-4通过了律师资格考试的前10%。

那些被低估的AI突破

反过来，很多真正的突破在当时却被忽视了：

2012年，AlexNet赢得了ImageNet比赛。当时只有计算机视觉圈的人关注。但回头看，这是深度学习革命的”第一枪”。

2017年，谷歌发表了Transformer论文。论文标题《Attention is All You Need》霸气十足，但当时引用量很低。6年后，它成了ChatGPT、Claude、Gemini的共同基础。

2020年，OpenAI发布GPT-3。当时很多AI研究者说”这不过是个更大的语言模型”。2年后，基于GPT-3.5的ChatGPT改变了世界。

一个有趣的对比

时间	AI的”硬件”	类比

|——|————|——|

1960年代	大型机（百万美元一台）	只有国家能搞AI
1990年代	工作站（几万美元）	大学和企业能搞AI
2010年代	GPU集群（几千美元）	创业公司能搞AI
2020年代	你的笔记本电脑	每个人都能用AI

AI的门槛在不断降低。2026年的今天，你甚至可以在自己的笔记本电脑上运行一个开源大模型——这在10年前是不可想象的。

深度思考题

想一个问题：AI的下一次”寒冬”会来吗？

有人说不会，因为AI已经找到了真正的商业化路径（不像1970年代只有政府资助）。也有人说会，因为当前的AI投资热潮有泡沫成分（很多公司在烧钱没有盈利）。

我的看法是：即使有泡沫破裂，AI也不会像前两次寒冬那样”消失”。原因很简单——这次AI已经深入到了普通人的日常生活中。你可以砍掉一个实验室的经费，但你没法让10亿人停止使用手机上的AI功能。

这是AI历史上第一次，寒冬来了也不会真正冷下去。

与今天的主题相关的最新动态

2026年5月最新：

OpenAI宣布GPT-5开发中：据报道，GPT-5将具备更强的推理能力和更长的上下文窗口。这是从GPT-4到GPT-5的又一次”参数量跃迁”。

开源模型持续追赶：Llama 4和Qwen 3系列在多项基准测试上已经接近甚至超越GPT-4。开源和闭源的差距在快速缩小。

AI Agent成为新战场：2026年最大的AI趋势不是更大的模型，而是更”能干”的Agent。各大公司都在让AI从”回答问题”进化到”帮你做事”——这也是我们课程后面会重点讲的内容。

下篇预告

明天早上8点：数据——AI的粮食！为什么说”数据为王”。你会理解为什么同样的算法，用不同的数据训练出来效果天差地别。

今晚5点：2026年AI格局全景图——哪些技术正在改变世界。带你看清当前AI技术的全貌，知道哪些是真正值得关注的方向。

系列课程：AI专家养成计划 70天140篇

适合人群：零基础、对AI感兴趣的任何人

互动：有问题欢迎在评论区留言，我会一一回复