第03课:AI数据分析与可视化
第03课:AI数据分析与可视化
一、AI数据分析的革命性变化
1.1 传统数据分析 vs AI数据分析
| 维度 | 传统方式 | AI方式 |
|---|---|---|
| 数据清洗 | 手动写公式,逐列检查(2小时) | 描述需求,AI自动清洗(5分钟) |
| 分析思路 | 需要统计学基础 | 用自然语言提问即可 |
| 公式/代码 | 必须记住函数语法 | 告诉AI你想要什么 |
| 可视化 | 调图表格式(30分钟) | AI推荐并生成图表(2分钟) |
| 报告撰写 | 手工编写文字(1小时) | AI自动生成分析结论 |
1.2 你不需要懂统计学
以前做数据分析需要:
- 统计学基础(均值、中位数、标准差…)
- Excel高级函数(VLOOKUP、INDEX-MATCH、透视表…)
- 可能还需要SQL、Python
现在只需要:
- 能描述你想知道什么(自然语言)
- 能判断结果是否合理(常识)
- 能把数据喂给AI(复制粘贴)
二、AI数据清洗
2.1 常见数据问题
| 问题类型 | 示例 | AI处理方式 |
|---|---|---|
| 缺失值 | 部分单元格为空 | 自动识别并建议填充策略 |
| 格式不一致 | 日期有的写2026/4/1有的写4月1日 | 统一格式 |
| 重复数据 | 同一客户出现多次 | 自动去重并保留最新 |
| 异常值 | 年龄=999,金额=-100 | 标记异常并建议处理 |
| 分类混乱 | “上海”、“上海市”、“Shanghai” | 标准化分类 |
2.2 数据清洗Prompt
基础清洗:
以下是一份原始数据表格。请帮我:
1. 检查并标记缺失值
2. 统一日期格式为 YYYY-MM-DD
3. 去除重复行
4. 标记可能的异常值
5. 给出清洗后的干净数据
数据:
[粘贴数据]
高级清洗:
以下是两份数据表格需要合并:
表格1(客户信息):
[粘贴]
表格2(订单数据):
[粘贴]
请按照"客户ID"字段进行关联合并,并:
1. 处理ID不匹配的情况
2. 汇总每个客户的总订单金额
3. 计算每个客户的平均订单额
4. 按照消费金额降序排列
三、AI数据分析实战
3.1 销售数据分析
场景:你有一份月度销售数据,需要快速出分析报告。
Prompt:
分析以下销售数据,给出完整的分析报告:
月份,销售额,订单数,新客户数,退货率
2026-01,156000,320,45,3.2%
2026-02,142000,285,38,2.8%
2026-03,198000,412,62,3.5%
2026-04,175000,356,51,2.9%
请分析:
1. 整体趋势(增长还是下降?)
2. 关键指标变化(环比、同比)
3. 各指标之间的关联性
4. 异常数据点
5. 3条可执行的改进建议
6. 推荐做哪些图表来展示这些数据
3.2 用户行为分析
以下是网站用户行为数据:
页面,访问量,平均停留时间,跳出率,转化率
首页,50000,45秒,65%,2.1%
产品页,15000,3分钟,35%,8.5%
定价页,8000,2分钟,40%,15.2%
注册页,3000,1.5分钟,50%,32%
请分析:
1. 用户转化漏斗效率
2. 每个阶段的流失原因推测
3. 哪个页面最需要优化
4. 给出具体的优化建议
3.3 财务数据分析
分析以下部门季度费用数据:
部门,Q1预算,Q1实际,Q2预算,Q2实际
市场部,500000,620000,550000,580000
研发部,800000,785000,850000,830000
销售部,350000,410000,380000,395000
行政部,200000,195000,210000,225000
请分析:
1. 哪些部门超支?超支比例?
2. 费用控制最好的部门
3. 整体预算执行情况
4. Q2 vs Q1 的变化趋势
5. 给出费用控制建议
3.4 HR数据分析
分析以下员工调查数据:
部门,满意度(1-10),离职率,平均工龄(年),培训时长(小时/季度)
研发,7.5,8%,3.2,40
市场,6.2,15%,2.1,20
销售,5.8,22%,1.5,15
客服,6.0,18%,1.8,12
行政,7.0,10%,4.0,8
请分析:
1. 满意度与离职率的关系
2. 培训投入与满意度的关系
3. 最需要关注的部门
4. 降低整体离职率的建议
四、AI生成图表建议
4.1 图表选择指南
AI可以帮你选择最合适的图表类型:
我有以下数据需要可视化:
[描述数据]
请推荐最适合的图表类型,并说明:
1. 为什么选这种图表
2. X轴和Y轴分别放什么
3. 配色建议
4. 标注哪些关键数据点
4.2 常见图表场景
| 分析目标 | 推荐图表 | 适用场景 |
|---|---|---|
| 趋势变化 | 折线图 | 月度销售、用户增长 |
| 对比差异 | 柱状图 | 部门业绩、产品对比 |
| 占比构成 | 饼图/环形图 | 收入来源、费用构成 |
| 分布情况 | 直方图 | 年龄分布、工资分布 |
| 相关关系 | 散点图 | 广告投入vs销售 |
| 多维对比 | 雷达图 | 产品多维度评分 |
| 流程转化 | 漏斗图 | 用户转化漏斗 |
4.3 用AI生成图表代码
Python + Matplotlib:
请用Python matplotlib生成以下图表:
- 数据:[粘贴数据]
- 图表类型:带数据标签的柱状图
- 配色:蓝色系
- 标题:2026年Q1部门销售对比
- 导出为PNG文件(300dpi)
Excel图表指导:
我在Excel中有以下数据:
[描述数据位置]
请告诉我一步一步如何在Excel中:
1. 创建一个组合图(柱状图+折线图)
2. 柱状图显示销售额
3. 折线图显示增长率
4. 添加数据标签
5. 调整为专业商务风格
五、AI生成数据仪表盘
5.1 什么是数据仪表盘
数据仪表盘是将多个关键指标整合在一个页面上的可视化工具。老板们不想看一堆表格——他们想一目了然地知道:
- 业务好不好?
- 哪里有问题?
- 趋势在哪?
5.2 用AI设计仪表盘布局
我需要为公司管理层设计一个月度运营仪表盘,包含以下指标:
核心指标:
- 月营收、同比增长率
- 新客户数、客户获取成本
- 利润率
- 活跃用户数
请设计仪表盘布局:
1. 指标卡片的位置安排
2. 每个指标用什么图表展示
3. 颜色编码(正常/警告/危险)
4. 数据更新频率建议
5.3 用工具实现仪表盘
| 工具 | 难度 | 适合场景 |
|---|---|---|
| Excel 数据透视图 | ⭐⭐ | 小团队,数据量小 |
| 飞书多维表格 | ⭐ | 团队协作,实时更新 |
| Google Sheets + 图表 | ⭐⭐ | 免费,跨平台 |
| Notion + 数据库 | ⭐⭐ | 知识管理+数据一体 |
| Python + Streamlit | ⭐⭐⭐ | 自定义仪表盘 |
| Power BI | ⭐⭐⭐ | 企业级,数据量大 |
六、高级分析:让AI当你的数据科学家
6.1 趋势预测
基于以下12个月的销售数据,请:
1. 分析季节性规律
2. 预测未来3个月的销售趋势
3. 给出预测的置信区间
4. 说明可能影响预测的因素
数据:
[月度销售数据]
6.2 AB测试分析
我们做了一个定价AB测试:
A组(原价99元):1000人浏览,85人购买
B组(促销79元):1000人浏览,142人购买
请分析:
1. 两组转化率分别是多少
2. B组的提升是否有统计显著性
3. 考虑价格差异后,哪组的总收入更高
4. 建议采用哪个价格及原因
6.3 客户分层分析
基于以下客户数据,用RFM(最近购买时间、购买频次、消费金额)
模型进行客户分层:
[客户购买数据]
请输出:
1. 客户分为4-5层
2. 每层的特征描述
3. 每层的推荐营销策略
4. 各层客户数量占比
七、实操练习
练习1:5分钟数据分析
- 打开你的某份工作数据(考勤表、销售表、费用表均可)
- 复制粘贴给ChatGPT/Claude
- 要求AI做完整分析
- 对比你手动分析需要多长时间
练习2:制作一份数据报告
- 收集上个月的业务数据
- 让AI清洗数据
- 让AI分析趋势和问题
- 让AI推荐图表并描述
- 让AI撰写分析报告
练习3:建一个简易仪表盘
- 确定5个核心业务指标
- 在Excel/飞书中创建数据表
- 让AI指导你创建图表
- 组合成一个仪表盘页面
💡 下一课我们将学习AI邮件与日程自动化——让AI帮你自动分类、回复邮件,智能管理你的时间。