Day20——晚课 AI数据分析实战

作者:

系列教程说明

这是「AI专家养成计划」系列教程的第40篇,共140篇。从AI零基础出发,每天进步一点点。晚间实践课以动手为主——跟着做一遍,你就能掌握今天的内容。

上篇回顾

今天早课我们了解了AI数据分析的全貌。三个核心要点:

  • AI数据分析的核心价值:把”看数据头疼”变成”问AI就行”,从一天的工作缩短到十分钟
  • AI能做四件事:数据清洗、数据计算、数据可视化、报告生成
  • 关键技巧:给AI清晰的指令、分步骤提问、验证AI的结果

今晚,我们动手实操。准备好你的AI对话工具,开始吧。


准备工作

今晚的实操只需要两样东西:

  1. 一个AI对话工具——ChatGPT、Claude、通义千问都行
  2. 要分析的数据——我会提供示例数据,你也可以用自己的

小贴士:如果你用ChatGPT(Plus用户),可以直接上传Excel文件让AI分析。免费用户可以复制粘贴表格内容,效果一样。


实操一:用AI分析销售数据并生成报告

场景设定

你是公司运营,老板发来一份上季度的销售数据,让你”分析一下,出个报告”。数据如下:

`

日期,地区,产品类别,产品名称,销售额(元),数量,客户类型

2026-01-05,华东,电子产品,无线耳机,12800,32,企业

2026-01-12,华南,办公用品,人体工学椅,8500,17,个人

2026-01-18,华北,电子产品,机械键盘,6200,31,企业

2026-01-25,华东,办公用品,升降桌,15600,24,企业

2026-02-03,华南,电子产品,无线耳机,9800,25,个人

2026-02-10,华北,办公用品,人体工学椅,7200,14,企业

2026-02-18,华东,电子产品,平板电脑,28000,14,企业

2026-02-25,华南,办公用品,升降桌,11200,16,个人

2026-03-02,华北,电子产品,机械键盘,5800,29,个人

2026-03-08,华东,办公用品,人体工学椅,9600,19,企业

2026-03-15,华南,电子产品,平板电脑,22000,11,企业

2026-03-22,华北,办公用品,升降桌,13400,20,企业

2026-03-28,华东,电子产品,无线耳机,15200,38,个人

2026-03-30,华南,办公用品,人体工学椅,6800,14,个人

`

第一步:让AI帮你做整体概览

打开AI工具,输入:

我有一份销售数据(CSV格式),请帮我做整体概览分析:

1. 总共有多少条记录?时间范围?

2. 涉及哪些地区、产品类别、产品名称?

3. 总销售额、平均单笔销售额、总销量分别是多少?

4. 请用表格形式展示结果。

AI会返回类似这样的结果

指标 数值

|——|——|

记录数 14条
时间范围 2026年1月-3月
地区 华东、华南、华北(3个)
产品类别 电子产品、办公用品(2类)
总销售额 172,100元
平均单笔 12,293元
总销量 284件

第二步:让AI做多维度对比分析

继续对话:

请帮我做以下对比分析:

1. 各地区的销售额占比(用饼图展示)

2. 各产品类别的月度销售趋势(用折线图展示)

3. 企业客户vs个人客户的消费差异

4. 找出销售额最高的3个产品和最低的3个产品

AI会返回详细的分析结果,包括数据对比、图表代码(如果用ChatGPT,会直接生成图表)、以及发现的规律。比如:

地区分布:华东地区销售额最高(65,600元,占38.1%),华南次之(58,300元,占33.9%),华北最低(48,200元,占28.0%)。

>

客户类型差异:企业客户平均单笔订单金额(14,243元)明显高于个人客户(9,125元),但个人客户的购买频次更高。

>

产品表现:平板电脑虽然销量最低(25件),但销售额最高(50,000元),属于高客单价产品。无线耳机销量最高(95件),是走量型产品。

第三步:让AI生成完整报告

请把以上分析整理成一份正式的季度销售报告,要求:

1. 包含执行摘要(150字以内,给老板快速浏览)

2. 分章节详细分析(地区、产品、客户三个维度)

3. 每个章节有关键数据支撑

4. 结尾给出5条可执行的业务建议

5. 用专业但不晦涩的语言

这就是完整的”AI数据分析”工作流:概览 → 多维分析 → 报告生成。三步搞定,总耗时不超过15分钟。

关键感受:以前这种分析加报告至少要一天,现在和AI对话几轮就完成了。省下来的时间可以用来思考”为什么”和”怎么做”——这些才是人类的价值所在。


实操二:用AI清洗脏数据

场景设定

你收到一份问卷调查结果,但数据质量很差——缺失值、格式混乱、重复记录,样样都有:

`

姓名,年龄,城市,月收入,满意度评分

张三,28,北京,15000,4

李四,,上海,八千,5

王五,35,广州,12000,

赵六,42,北京,25000,3

张三,28,北京,15000,4

钱七,31,深圳,9500,2

孙八,26,杭州,,4

周九,29,上海,11000,6

吴十,38,北京,18000,3

`

向AI描述清洗需求

我有一份问卷数据,存在很多质量问题。请帮我写一个清洗方案:

>

数据问题:

1. 有缺失值(空的姓名、年龄、月收入、满意度评分)

2. 月收入格式不统一(有”八千”这种文字,有纯数字)

3. 有完全重复的记录(张三出现了两次)

4. 满意度评分应该在1-5之间,但有6分的异常值

>

请告诉我:

– 每种问题的处理策略(删除还是填充?)

– 如果填充,用什么值?为什么?

– 清洗后的数据应该是什么样的?

– 请用Python代码实现整个清洗流程

AI会给你一套完整的清洗方案,包括:

  1. 去重:删除完全重复的行(张三那条重复了)
  2. 格式统一:把”八千”转成数字8000
  3. 异常值处理:6分的满意度改为缺失值(因为超出1-5范围)
  4. 缺失值填充
  • 年龄:用中位数填充(29岁)
  • 月收入:用同城市的平均收入填充
  • 满意度评分:删除(评分不能随便猜)

重要提示:AI会解释每一步的处理逻辑。你不需要完全照做——根据你的业务理解来判断。比如AI建议用中位数填充年龄,但如果你知道这个人确实没填年龄,删除可能更合适。


实操三:让AI帮你做数据透视分析

场景设定

你有一份电商订单数据,想做交叉分析——不同地区、不同产品、不同时间的销售情况。

构建分析问题

我有一份电商订单数据,包含列:订单日期、地区、产品类别、销售额、数量。

>

请帮我做以下交叉分析:

1. 制作一个”地区×产品类别”的销售额交叉表

2. 制作一个”月份×产品类别”的销售趋势表

3. 计算每个地区的客单价(总销售额÷总订单数)

4. 找出”华东地区”的TOP3产品

5. 分析哪些”地区+产品”组合是高增长的,哪些是下滑的

进阶:让AI解读数据

分析完数据后,继续问:

根据以上分析结果,请帮我回答三个业务问题:

1. 下个季度应该重点投入哪个地区的哪个产品线?为什么?

2. 有哪些”地区+产品”组合表现不佳,需要调整策略?

3. 从数据中你发现了什么反直觉的规律?

这就是”数据分析+业务洞察”的完整闭环。AI不仅帮你算数字,还能帮你解读数字背后的含义。


四个让AI数据分析更高效的技巧

技巧一:先问框架,再填数据

如果你不知道该分析什么,先让AI给你一个框架:

我有一份[业务类型]的数据,包含[字段列表]。请帮我列出一个完整的分析框架,包括应该从哪些维度分析、用什么图表、关注什么指标。

拿到框架后,再逐项让AI执行。这比你直接问”帮我分析”效果好得多。

技巧二:让AI对比两种方案

当你犹豫该怎么做时,让AI给你两个方案:

对于这份销售数据,我想分析”哪个产品最赚钱”。请给我两种分析方案:

方案A:按总销售额排名

方案B:按利润率排名

请分别计算,并告诉我两种方案各自的优缺点。

技巧三:用”假设分析”探索可能性

如果华南地区的销售额增长20%,其他地区不变,整体业绩会提升多少?各地区的占比会如何变化?

AI能快速计算各种假设场景,帮你做决策。

技巧四:让AI生成可复用的分析模板

请帮我写一个通用的”月度销售分析”模板,包含:

1. 数据检查清单(哪些字段必须有、哪些不能有空值)

2. 核心分析维度(地区、产品、时间、客户类型)

3. 标准图表配置(柱状图、折线图、饼图分别展示什么)

4. 报告结构模板

>

以后我每月只需要把新数据导入,就能自动生成分析报告。

这样你就建立了一个可复用的分析流程,以后每月的分析工作从”从零开始”变成”一键生成”。


今日总结

今天晚课我们完成了三个动手实操:

  • 销售数据分析:完整的”概览→多维分析→报告生成”工作流,15分钟搞定老板要的报告
  • 脏数据清洗:处理缺失值、格式混乱、重复记录、异常值,让AI帮你制定清洗策略
  • 交叉分析与洞察:从数据中发现业务规律,让AI帮你解读数字背后的含义

核心收获:AI数据分析不是”让AI替你思考”,而是”让AI替你算,你来思考”。 算数和画图交给AI,判断和决策留给自己。


今日行动项

动手试试这三个练习,巩固今天学到的内容:

  • 初级:把今天实操一的销售数据复制到ChatGPT或Claude中,完整走一遍”概览→分析→报告”的流程
  • 中级:从你的工作中找一份真实数据(脱敏后),让AI帮你做清洗和分析
  • 高级:让AI帮你建立一个”月度数据分析模板”,包含数据检查、核心分析维度、标准图表、报告结构,以后每月复用

📖 地铁深读:AI数据分析的局限性——它不能替代你的判断力

这个板块专为地铁通勤设计,每篇5-10分钟。不想深读可以跳过,不影响主线学习。

AI会”过度解读”数据

一个真实的案例:某零售公司让AI分析销售数据,AI发现”下雨天雨伞销量增加”,于是建议”多进货雨伞”。

听起来合理?但AI忽略了一个关键信息:这家店的雨伞已经供不应求了。多进货不会增加销量,只会增加库存成本。

AI看到的是数据中的”相关性”,但不理解业务中的”因果性”。 它不知道你的库存限制、供应链约束、竞争环境。所以AI的分析结果,永远需要人类来判断”能不能做”和”该不该做”。

“垃圾进,垃圾出”的陷阱

AI分析的质量,完全取决于数据的质量。

一个经典案例:某公司让AI分析客户满意度,数据来源是在线问卷。AI分析后发现”满意度高达4.7分(满分5分)”,结论是”客户很满意,无需改进”。

但实际上,只有满意的客户才会花时间填问卷。不满意的客户早就流失了,根本不会填。这个4.7分只代表了”还愿意和你打交道的客户”的意见,而不是所有客户的意见。

数据偏差是AI分析最大的敌人。 AI不会主动告诉你”你的数据有偏差”——它只会忠实地分析你给它的数据。所以,在让AI分析之前,先问自己:这个数据能代表真实情况吗?

三个”AI分析”的常见误区

误区一:AI说的都是对的

AI可能会犯计算错误,特别是涉及百分比、增长率、同比环比时。一定要抽查关键数字。

误区二:图表越多越好

AI可以生成很多图表,但不是每个图表都有意义。好的分析是”用最少的图表讲最清楚的故事”,不是”图表大轰炸”。

误区三:分析完就结束了

数据分析的目的是指导行动。如果你分析完数据,写完报告,然后什么都没改变——那这次分析就是浪费时间。每次分析结束后,问自己:基于这个分析,我要做什么?

思考题

  1. 你日常工作中,有哪些”数据分析”任务可以让AI帮你完成?列出3个。
  2. 你见过哪些”数据误导决策”的案例?AI分析能避免这些误导吗?
  3. 如果AI的分析结果和你的经验判断不一致,你会怎么处理?

推荐学习资源

  • 《数据化决策》(道格拉斯·哈伯德):教你如何用数据做出更好的商业决策
  • Kaggle Datasets:全球最大的开放数据集平台,可以下载真实数据练手
  • ChatGPT Code Interpreter:最强的AI数据分析工具,支持上传文件、运行代码、生成图表

下篇预告

明天早上8点:Day21——AI办公自动化实战

明天下午5点:Day21——晚课 AI办公自动化实操


*这是「AI专家养成计划」系列教程的一部分。每天早上8点,我们用10-15分钟帮你掌握AI技能。关注我,一起成长。*

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注