跳转至

工作流 18:从表格数据到可汇报分析结论的 AI 多专家工作流

适用岗位:运营人员、财务人员、业务分析人员、项目管理人员、数据初学者

真实场景:你手上有一份业务数据表格(销售明细、用户行为、财务流水等),需要从中分析出可汇报的结论,但你不确定指标口径对不对、异常值怎么处理、能不能下因果结论——你需要一套严谨的分析流程,避免分析出错误结论。

最终目标:一份可汇报的数据分析报告,包含:字段理解、数据质量评估、校准后的指标口径、异常值处理、趋势分析、分组对比、有依据的结论、图表建议。数据不足时明确说明"无法得出结论",而非编造。


输入材料清单

  • 数据表格(CSV / Excel / 数据库导出,含字段名和数据)
  • 分析目的(想回答什么业务问题)
  • 业务背景(这些数据来自什么业务,关键术语含义)
  • 已知的指标定义(如有,公司对某些指标的标准口径)
  • 数据时间范围和采集方式(如已知)

工作流总览

节点 1:数据字段理解专家
  ↓ 输出:字段含义清单 + 数据类型
节点 2:数据质量检查专家
  ↓ 输出:数据质量报告(缺失/重复/异常)
节点 3:指标口径校准专家(招牌节点)
  ↓ 输出:校准后的指标定义清单
节点 4:异常值识别专家
  ↓ 输出:异常值清单 + 处理建议
节点 5:趋势分析专家
  ↓ 输出:趋势分析结果(含数据支撑)
节点 6:分组对比专家
  ↓ 输出:分组对比结果
节点 7:结论提炼专家
  ↓ 输出:有依据的结论(区分确定/推测/无法判断)
节点 8:图表建议专家
  ↓ 输出:图表类型建议
节点 9:分析报告生成专家
  ↓ 输出:完整分析报告
最终交付:可汇报分析报告

专家节点详解

每个节点包含六部分:节点定位、输入与输出、使用顺序、提示词包(A 快速 / B 专家 / C 自查 / D 返修)、交付给下游节点、人工验收清单。

C 自查审稿版和 D 返修优化版是当前节点内部的工作模式,不是新的专家角色。

核心原则:不编造数据、不把相关当因果、数据不足时如实说"无法得出结论"。 严谨优先于"给出漂亮结论"。


节点 1:数据字段理解专家

1.1 节点定位

理解数据表格中每个字段的含义、类型和取值范围,建立分析的基础认知。不理解字段就分析,等于盲人摸象。

1.2 输入与输出

输入:数据表格(字段名 + 样本数据)+ 业务背景

输出:字段含义清单(字段 + 含义 + 类型 + 取值范围 + 存疑项)

1.3 使用顺序

  1. 先用「快速生成版」理解字段。
  2. 字段多或含义模糊时,改用「专家增强版」。
  3. 用「自查审稿版」检查是否有字段含义靠猜、是否标注存疑。
  4. 有问题则用「返修优化版」修正。
  5. 对照 1.6 验收清单确认,通过后交给节点 2 和节点 3。

1.4 提示词包

A. 快速生成版
你是一位数据分析师。请理解以下数据表格的字段。

字段名和样本数据:【粘贴表头和几行样本】
业务背景:【填入】

输出:
| 字段名 | 推测含义 | 数据类型 | 取值范围/示例 | 是否需确认 |
含义不确定的字段,标注"需向业务方确认",不强行猜测。
B. 专家增强版
你是一位资深数据分析师。

任务:理解数据表格的每个字段,为后续分析建立准确认知。

输入:
- 字段名和样本数据:【粘贴表头和样本行】
- 业务背景:【填入】
- 已知字段定义:【填入或留空】

处理步骤:
1. 对每个字段判断含义(结合字段名和样本数据)
2. 标注数据类型(数值/分类/日期/文本/布尔)
3. 标注取值范围或类别(数值看分布,分类看有哪些值)
4. 识别关键字段(用于分组、计算指标的字段)
5. 标注含义不明确、需向业务方确认的字段

输出格式:
| 字段名 | 含义 | 类型 | 取值范围 | 关键字段 | 确认状态 |

约束(关键):含义不确定的字段标注"需确认",不强行赋予含义;不臆测字段间的关系;以样本数据为准,不脑补。

质量标准:字段理解准确,关键字段识别到位,不确定的明确标出,避免基于错误理解做分析。

常见失败情况:望文生义猜错字段含义;把编码字段(如状态码1/2/3)当成数值计算;不标注存疑字段。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下字段理解是否存在以下问题:
1. 是否有字段含义靠望文生义猜测(而非基于样本数据)?
2. 是否把编码/分类字段(如状态码)误判为可计算的数值?
3. 含义不明确的字段是否标注"需确认"?
4. 关键字段是否识别到位?

【粘贴字段理解】

逐条说明问题。
D. 返修优化版
根据自查意见修正字段理解。将望文生义的含义改为"需确认",纠正编码字段的类型误判,补充存疑标注。

原始字段理解:【粘贴原始内容】
自查意见:【粘贴自查结果】

1.5 交付给下游节点

将字段含义清单复制,交给节点 2(数据质量检查专家)和节点 3(指标口径校准专家)。

1.6 人工验收清单

  • [ ] 字段含义是否基于样本数据而非望文生义?
  • [ ] 编码/分类字段是否没有被误判为可计算数值?
  • [ ] 不明确的字段是否标注"需确认"?

节点 2:数据质量检查专家

2.1 节点定位

检查数据的质量问题——缺失值、重复、格式错误、明显异常,评估数据是否足以支撑分析。脏数据会让分析结论失真。

2.2 输入与输出

输入:数据表格 + 节点 1 字段清单

输出:数据质量报告(缺失/重复/格式/样本量评估)

2.3 使用顺序

  1. 先用「快速生成版」检查质量问题。
  2. 数据量大或质量问题复杂时,改用「专家增强版」。
  3. 用「自查审稿版」检查是否遗漏质量问题、样本量评估是否合理。
  4. 有问题则用「返修优化版」补充。
  5. 对照 2.6 验收清单确认,通过后交给节点 4。

2.4 提示词包

A. 快速生成版
你是一位数据质量检查员。请检查以下数据的质量问题。

数据:【粘贴数据或描述数据规模】
字段清单:【粘贴节点1】

检查:
1. 缺失值(哪些字段有空值,比例多少)
2. 重复记录
3. 格式不一致(日期、数值格式)
4. 样本量是否足够分析
输出问题清单 + 对分析的影响。
B. 专家增强版
你是一位数据质量专家。

任务:系统检查数据质量,评估是否足以支撑分析。

输入:
- 数据:【粘贴数据或描述规模和样本】
- 字段清单:【粘贴节点1】
- 分析目的:【填入】

检查维度:
1. 完整性(各字段缺失值比例,关键字段是否大量缺失)
2. 唯一性(是否有重复记录,主键是否唯一)
3. 一致性(日期格式、数值单位、分类取值是否统一)
4. 合理性(数值是否在合理范围,有无明显录入错误)
5. 样本量(总量是否足够,分组后每组样本是否足够分析)

对每个问题评估:
- 问题描述和影响范围
- 对分析结论的影响程度
- 处理建议(删除/填充/标注/不影响)

输出格式:
| 质量问题 | 涉及字段 | 严重程度 | 对分析的影响 | 处理建议 |
+ 样本量评估结论(是否足以支撑分析目的)

约束(关键):如实报告质量问题,不掩盖;样本量不足时明确指出哪些分析做不了;不建议用编造数据填补缺失。

质量标准:数据质量问题被全面识别,样本量评估诚实,为后续分析划定可靠性边界。

常见失败情况:忽略缺失值直接分析;样本量不足却不提示;建议用均值等填充关键缺失却不说明影响。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下数据质量报告是否存在以下问题:
1. 是否检查了关键字段的缺失值比例?
2. 样本量不足以支撑某些分析时,是否明确指出?
3. 处理建议是否包含了"用编造/估算数据填补"(不应该)?
4. 是否如实报告了所有质量问题,没有掩盖?

【粘贴数据质量报告】

逐条说明问题。
D. 返修优化版
根据自查意见完善数据质量报告。补充缺失值检查,明确样本量限制,移除用编造数据填补的建议,补回被掩盖的问题。

原始报告:【粘贴原始报告】
自查意见:【粘贴自查结果】

2.5 交付给下游节点

将数据质量报告复制,交给节点 4(异常值识别专家)。样本量评估结论会影响后续分析的可靠性判断。

2.6 人工验收清单

  • [ ] 是否检查了关键字段的缺失值?
  • [ ] 样本量不足时是否明确指出?
  • [ ] 是否没有建议用编造数据填补?

节点 3:指标口径校准专家(招牌节点)

3.1 节点定位

这是本工作流的招牌节点。 校准分析中用到的每个指标的口径,这是数据分析最容易出错、也最容易被忽视的环节。本节点必须解决:

校准项 要回答的问题
指标口径是否唯一 同一指标(如"活跃用户")是否有多种定义?用哪种?
分子分母是否清楚 比率类指标(如转化率)的分子分母分别是什么?
时间范围是否一致 对比的数据是否在相同时间范围?
分组维度是否合理 按什么分组?分组是否互斥、是否完整?
相关性 vs 因果 是否会把"相关"误说成"导致"?
样本量是否足够 计算这个指标的样本量够吗?
口径是否前后一致 同一指标在报告多处是否用了一致口径?

口径错了,后面所有分析都是错的——这是分析的"地基检查"。

3.2 输入与输出

输入:节点 1 字段清单 + 分析目的 + 已知指标定义(如有)

输出:校准后的指标定义清单(指标 + 口径 + 分子分母 + 时间范围 + 注意事项)

3.3 使用顺序

  1. 先用「快速生成版」校准指标口径。
  2. 指标复杂或涉及比率/同比环比时,必须使用「专家增强版」。
  3. 用「自查审稿版」检查口径是否唯一、是否有因果误判风险。
  4. 有问题则用「返修优化版」修正。
  5. 对照 3.6 验收清单确认,通过后交给节点 5 和节点 6。

3.4 提示词包

A. 快速生成版
你是一位指标口径校准专家。请校准分析要用的指标口径。

字段清单:【粘贴节点1】
分析目的:【填入要分析什么】
已知指标定义:【填入或留空】

对每个指标校准:
1. 明确定义(这个指标到底算什么)
2. 比率类:分子是什么、分母是什么
3. 时间范围
4. 计算用的字段
口径有歧义的,列出可能的几种定义,标注需确认。
B. 专家增强版
你是一位资深数据分析专家,深知指标口径不清是错误结论的首要来源。

任务:校准分析中每个指标的口径,消除歧义。

输入:
- 字段清单:【粘贴节点1】
- 分析目的:【填入】
- 已知指标定义:【填入或留空】
- 数据质量报告(样本量):【粘贴节点2结论】

校准维度(逐个指标):
1. 指标定义唯一性
   - 这个指标是否有多种常见定义(如"活跃用户"可按登录/操作/付费定义)
   - 如有歧义,列出选项并标注需确认用哪个
2. 分子分母(比率类指标)
   - 明确分子是什么、分母是什么
   - 检查分母是否会为零、是否口径一致
3. 时间范围
   - 指标统计的时间范围
   - 对比分析时,各组时间范围是否一致
4. 分组维度
   - 按什么维度分组
   - 分组是否互斥(不重叠)、是否完整(无遗漏)
5. 因果性提示
   - 标注哪些指标关系只能说"相关",不能说"导致"
6. 样本量
   - 该指标的计算样本量是否足够(结合节点2)
7. 一致性
   - 同一指标在不同分析中是否会用一致口径

输出格式:
| 指标 | 口径定义 | 分子/分母 | 时间范围 | 分组维度 | 样本量 | 因果提示 | 确认状态 |

约束(关键):口径有歧义必须列出并标注需确认,不擅自选定;明确区分相关与因果;样本不足的指标标注"结论不可靠"。

质量标准:每个指标口径清晰唯一、分子分母明确、时间范围一致,为可靠分析奠定基础。

常见失败情况:用了模糊的指标定义("活跃"不说明怎么算);比率指标分母不清;不同时间范围的数据直接对比;把相关当因果。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下指标口径校准是否存在以下问题:
1. 是否有指标定义模糊(如"活跃用户"没说明按什么算)?
2. 比率类指标的分子分母是否都明确?
3. 对比分析的各组时间范围是否一致?
4. 是否有指标关系存在"把相关当因果"的风险却没标注?
5. 样本量不足的指标是否标注了"结论不可靠"?

【粘贴指标口径校准】

逐条说明问题。
D. 返修优化版
根据自查意见修正指标口径校准。明确模糊定义或标注需确认,补全分子分母,统一时间范围,标注因果风险,标注样本不足的指标。

原始校准:【粘贴原始校准】
自查意见:【粘贴自查结果】

3.5 交付给下游节点

将校准后的指标定义清单复制,交给节点 5(趋势分析专家)和节点 6(分组对比专家)。所有分析必须基于校准后的口径。

3.6 人工验收清单

  • [ ] 每个指标的定义是否唯一清晰(无模糊)?
  • [ ] 比率类指标的分子分母是否明确?
  • [ ] 对比分析的时间范围是否一致?
  • [ ] 是否标注了相关性不等于因果的指标?
  • [ ] 样本量不足的指标是否标注"结论不可靠"?

节点 4:异常值识别专家

4.1 节点定位

识别数据中的异常值,判断是真实异常还是数据错误,给出处理建议。异常值处理不当会严重扭曲分析结果——但盲目删除异常值也可能丢掉重要信息。

4.2 输入与输出

输入:数据表格 + 节点 3 指标口径 + 节点 2 质量报告

输出:异常值清单(异常值 + 可能原因 + 处理建议)

4.3 使用顺序

  1. 先用「快速生成版」识别异常值。
  2. 异常值多或需区分真异常和错误时,改用「专家增强版」。
  3. 用「自查审稿版」检查是否误判、处理建议是否合理。
  4. 有问题则用「返修优化版」修正。
  5. 对照 4.6 验收清单确认,通过后交给节点 5。

4.4 提示词包

A. 快速生成版
你是一位异常值识别员。请识别数据中的异常值。

数据:【粘贴数据或关键字段】
指标口径:【粘贴节点3】

输出:
| 异常值 | 所在字段 | 异常程度 | 可能原因(真实异常/录入错误)| 处理建议 |
不要直接删除异常值,先判断是真实业务异常还是数据错误。
B. 专家增强版
你是一位数据异常分析专家。

任务:识别异常值,区分真实异常和数据错误,给出处理建议。

输入:
- 数据:【粘贴数据或关键字段分布】
- 指标口径:【粘贴节点3】
- 数据质量报告:【粘贴节点2】

处理步骤:
1. 识别数值异常(远超正常范围的值)
2. 识别逻辑异常(如年龄为负、结束时间早于开始时间)
3. 对每个异常判断可能原因:
   - 真实业务异常(如大客户的超大订单——有意义,不应删)
   - 数据录入/采集错误(如多打一个零——应修正或剔除)
   - 缺失值的特殊编码(如用 -1 或 9999 表示缺失)
4. 评估异常值对分析的影响(是否会扭曲均值、趋势)
5. 给出处理建议(保留/修正/剔除/单独分析),说明理由

输出格式:
| 异常值 | 字段 | 异常类型 | 可能原因 | 对分析影响 | 处理建议 | 理由 |

约束(关键):不盲目删除异常值;真实业务异常应保留(可能是重要信息);剔除任何数据都要说明理由;不为了"让结论好看"而删数据。

质量标准:异常值得到合理甄别,真实异常被保留,错误数据被识别,处理建议有据可依。

常见失败情况:把真实的大客户订单当异常删掉;把缺失值编码(9999)当真实值计算;为美化结论删除不利数据。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下异常值处理是否存在以下问题:
1. 是否把真实业务异常(如大客户订单)误判为错误要删除?
2. 是否识别了缺失值的特殊编码(-1/9999 等)?
3. 每个"剔除"建议是否说明了理由?
4. 是否存在为美化结论而删除不利数据的倾向?

【粘贴异常值处理】

逐条说明问题。
D. 返修优化版
根据自查意见修正异常值处理。保留被误判的真实异常,识别缺失值编码,为剔除建议补充理由,撤销为美化结论的删除。

原始处理:【粘贴原始处理】
自查意见:【粘贴自查结果】

4.5 交付给下游节点

将异常值清单和处理建议复制,交给节点 5(趋势分析专家)。分析时按建议处理异常值。

4.6 人工验收清单

  • [ ] 是否没有把真实业务异常误判为要删除的错误?
  • [ ] 是否识别了缺失值的特殊编码?
  • [ ] 每个剔除建议是否说明了理由?

节点 5:趋势分析专家

5.1 节点定位

分析数据随时间的变化趋势,找出增长、下降、波动、周期等模式,并用数据支撑。趋势分析要基于校准的口径,结论要有数据依据。

5.2 输入与输出

输入:数据表格 + 节点 3 指标口径 + 节点 4 异常值处理

输出:趋势分析结果(趋势描述 + 数据支撑 + 可靠性说明)

5.3 使用顺序

  1. 先用「快速生成版」分析趋势。
  2. 趋势复杂或需区分趋势和波动时,改用「专家增强版」。
  3. 用「自查审稿版」检查趋势是否有数据支撑、是否过度解读。
  4. 有问题则用「返修优化版」修正。
  5. 对照 5.6 验收清单确认,通过后交给节点 7。

5.4 提示词包

A. 快速生成版
你是一位趋势分析师。请分析数据的趋势。

数据:【粘贴时间序列数据】
指标口径:【粘贴节点3】

输出:
1. 主要趋势(增长/下降/波动/平稳)
2. 趋势的数据支撑(具体数字变化)
3. 是否有周期性或季节性
每个趋势结论必须有数据支撑,不过度解读短期波动。
B. 专家增强版
你是一位资深趋势分析专家。

任务:分析数据的时间趋势,结论必须有数据支撑。

输入:
- 时间序列数据:【粘贴数据】
- 指标口径:【粘贴节点3】
- 异常值处理:【粘贴节点4】

处理步骤:
1. 识别主趋势(整体增长/下降/平稳/波动)
2. 用具体数据支撑趋势(起止值、变化幅度、变化率)
3. 区分趋势和短期波动(不把一两个点的波动当趋势)
4. 识别周期性/季节性(如有足够数据支撑)
5. 标注趋势的可靠性(数据点是否足够、时间跨度是否足够判断趋势)
6. 对数据不足以判断趋势的,明确说明

输出格式:
| 趋势 | 数据支撑(起止值/变化率)| 时间范围 | 可靠性 | 说明 |

约束(关键):每个趋势结论必须有具体数据支撑;不把短期波动当长期趋势;数据点不足时明确说"数据不足以判断趋势";不外推预测(除非明确要求且说明假设)。

质量标准:趋势分析有数据支撑,区分趋势和波动,可靠性诚实标注。

常见失败情况:把两三个点的波动夸大成趋势;无数据支撑的趋势断言;用短期数据预测长期;忽略季节性误判趋势。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下趋势分析是否存在以下问题:
1. 每个趋势结论是否有具体数据支撑?
2. 是否把短期波动(两三个点)夸大成了趋势?
3. 数据点不足时是否明确说"数据不足以判断趋势"?
4. 是否做了无依据的外推预测?

【粘贴趋势分析】

逐条说明问题。
D. 返修优化版
根据自查意见修正趋势分析。为无支撑的趋势补充数据或降级表述,把波动改回波动不夸大为趋势,标注数据不足项,删除无依据外推。

原始趋势分析:【粘贴原始内容】
自查意见:【粘贴自查结果】

5.5 交付给下游节点

将趋势分析结果复制,交给节点 7(结论提炼专家)。

5.6 人工验收清单

  • [ ] 每个趋势是否有具体数据支撑?
  • [ ] 是否没有把短期波动夸大成趋势?
  • [ ] 数据不足时是否明确说明?

节点 6:分组对比专家

6.1 节点定位

按不同维度分组对比数据,找出差异和规律。分组对比要确保分组合理、对比公平(同口径、同时间范围)。

6.2 输入与输出

输入:数据表格 + 节点 3 指标口径(分组维度)

输出:分组对比结果(分组 + 对比指标 + 差异 + 可靠性)

6.3 使用顺序

  1. 先用「快速生成版」做分组对比。
  2. 分组维度多或需多维交叉时,改用「专家增强版」。
  3. 用「自查审稿版」检查分组是否合理、对比是否公平。
  4. 有问题则用「返修优化版」修正。
  5. 对照 6.6 验收清单确认,通过后交给节点 7。

6.4 提示词包

A. 快速生成版
你是一位数据对比分析师。请按维度分组对比数据。

数据:【粘贴数据】
指标口径和分组维度:【粘贴节点3】

输出:
| 分组 | 对比指标 | 各组数值 | 差异 | 各组样本量 |
确保各组口径一致、时间范围一致。样本量小的组标注"差异可能不可靠"。
B. 专家增强版
你是一位资深分组对比分析专家。

任务:按维度分组对比,确保对比公平、差异可靠。

输入:
- 数据:【粘贴数据】
- 指标口径和分组维度:【粘贴节点3】

处理步骤:
1. 按指定维度分组(确保分组互斥、完整)
2. 对每组计算对比指标(用相同口径)
3. 确认对比公平性(各组时间范围、计算方式是否一致)
4. 标注各组样本量(小样本组的差异可能不可靠)
5. 描述差异(哪组高哪组低,差异幅度)
6. 对差异是否显著做谨慎判断(小样本或差异微小时,不夸大)
7. 不对差异原因下因果结论(除非有明确依据)

输出格式:
| 分组 | 指标值 | 样本量 | 与其他组差异 | 差异可靠性 |
+ 对比公平性说明

约束(关键):各组必须同口径、同时间范围;小样本组标注差异不可靠;不把分组差异直接归因(相关≠因果);样本量悬殊的对比要提示。

质量标准:分组合理、对比公平、差异如实呈现,不夸大不可靠的差异,不妄下因果。

常见失败情况:不同时间范围的组直接对比;小样本组(如 3 个样本)的差异当成规律;把分组差异直接说成"因为 X 导致"。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下分组对比是否存在以下问题:
1. 各组的口径和时间范围是否一致(对比是否公平)?
2. 小样本组的差异是否标注了"可能不可靠"?
3. 是否把分组差异直接归因(相关当因果)?
4. 分组是否互斥完整(无重叠、无遗漏)?

【粘贴分组对比】

逐条说明问题。
D. 返修优化版
根据自查意见修正分组对比。统一各组口径时间范围,标注小样本差异不可靠,删除因果归因,修正分组划分。

原始对比:【粘贴原始对比】
自查意见:【粘贴自查结果】

6.5 交付给下游节点

将分组对比结果复制,交给节点 7(结论提炼专家)。

6.6 人工验收清单

  • [ ] 各组口径和时间范围是否一致?
  • [ ] 小样本组差异是否标注不可靠?
  • [ ] 是否没有把分组差异直接归因?

节点 7:结论提炼专家

7.1 节点定位

从趋势和对比分析中提炼结论,严格区分"数据支持的确定结论""有依据的推测""数据不足无法判断"。这是分析的价值落点,也是最容易过度宣称的环节。

7.2 输入与输出

输入:节点 5 趋势分析 + 节点 6 分组对比 + 节点 3 指标口径

输出:分级结论(确定结论 / 推测 / 无法判断,各含依据)

7.3 使用顺序

  1. 先用「快速生成版」提炼结论。
  2. 结论涉及决策建议时,改用「专家增强版」。
  3. 用「自查审稿版」检查结论是否有依据、是否过度宣称。
  4. 有问题则用「返修优化版」修正。
  5. 对照 7.6 验收清单确认,通过后交给节点 8。

7.4 提示词包

A. 快速生成版
你是一位结论提炼分析师。请从分析中提炼结论。

趋势分析:【粘贴节点5】
分组对比:【粘贴节点6】

按以下三级分类输出结论:
1. 数据支持的确定结论(有充分数据支撑)
2. 有依据的推测(数据有所指向但不充分)
3. 数据不足无法判断的问题
每条结论标注支撑它的数据。不把推测写成确定结论。
B. 专家增强版
你是一位资深数据分析结论专家。

任务:从分析结果中提炼结论,严格区分确定性等级。

输入:
- 趋势分析:【粘贴节点5】
- 分组对比:【粘贴节点6】
- 指标口径(含因果提示):【粘贴节点3】
- 分析目的:【填入】

处理步骤:
1. 提炼回答分析目的的结论
2. 对每条结论判定确定性等级:
   - 确定结论:有充分数据支撑,口径可靠,样本充足
   - 推测:数据有指向但不充分(小样本、短期、相关非因果)
   - 无法判断:数据不足以回答的问题
3. 为每条确定结论标注数据支撑
4. 对推测,说明为什么只能是推测(缺什么才能确定)
5. 对无法判断的,说明需要什么数据才能回答
6. 严格避免把相关说成因果

输出格式:
- 确定结论(结论 + 数据支撑)
- 推测(推测 + 指向性依据 + 为何不确定)
- 无法判断(问题 + 缺什么数据)

约束(关键):不把推测包装成确定结论;不把相关说成因果;数据无法回答的问题诚实说"无法判断",绝不编造结论来满足分析目的。

质量标准:结论分级清晰,每条确定结论有支撑,推测和无法判断如实标注,经得起质疑。

常见失败情况:为回答分析目的硬凑结论;把相关当因果("A 高的组 B 也高,所以 A 导致 B");把推测说成确定。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下结论提炼是否存在以下问题:
1. 是否把推测包装成了"确定结论"?
2. 是否存在把相关性说成因果("因为 A 所以 B")?
3. 数据无法回答的问题是否诚实标注"无法判断"(而非硬凑结论)?
4. 每条确定结论是否有数据支撑?

【粘贴结论提炼】

逐条说明问题。
D. 返修优化版
根据自查意见修正结论提炼。把无充分支撑的"确定结论"降级为推测,将因果表述改为相关表述,为硬凑的结论改标"无法判断",补充数据支撑。

原始结论:【粘贴原始结论】
自查意见:【粘贴自查结果】

7.5 交付给下游节点

将分级结论复制,交给节点 8(图表建议专家)和节点 9(分析报告生成专家)。

7.6 人工验收清单

  • [ ] 是否区分了确定结论、推测、无法判断?
  • [ ] 是否没有把相关性说成因果?
  • [ ] 数据不足的问题是否诚实标"无法判断"?
  • [ ] 每条确定结论是否有数据支撑?

节点 8:图表建议专家

8.1 节点定位

为分析结论建议合适的图表类型,让数据可视化更有效。合适的图表让结论一目了然,错误的图表会误导。

8.2 输入与输出

输入:节点 5 趋势 + 节点 6 对比 + 节点 7 结论

输出:图表类型建议(数据 + 推荐图表 + 理由 + 注意事项)

8.3 使用顺序

  1. 先用「快速生成版」建议图表。
  2. 数据维度多或需组合图表时,改用「专家增强版」。
  3. 用「自查审稿版」检查图表类型是否匹配数据、是否会误导。
  4. 有问题则用「返修优化版」修正。
  5. 对照 8.6 验收清单确认,通过后交给节点 9。

8.4 提示词包

A. 快速生成版
你是一位数据可视化顾问。请为分析结论建议图表。

趋势分析:【粘贴节点5】
分组对比:【粘贴节点6】

输出:
| 要展示的内容 | 推荐图表类型 | 理由 |
趋势用折线图,对比用柱状图,占比用饼图(类别少时)。注意不要用误导性图表。
B. 专家增强版
你是一位数据可视化专家。

任务:为分析结论建议最合适的图表类型。

输入:
- 趋势分析:【粘贴节点5】
- 分组对比:【粘贴节点6】
- 结论:【粘贴节点7】

处理步骤:
1. 为每个要展示的分析点选择图表类型:
   - 时间趋势 → 折线图
   - 分类对比 → 柱状图/条形图
   - 占比构成 → 饼图(类别≤5)/堆叠柱状图
   - 分布 → 直方图/箱线图
   - 相关关系 → 散点图(但提示相关≠因果)
2. 说明每个选择的理由
3. 标注图表设计注意事项(坐标轴是否从零开始、是否避免 3D 失真、配色是否清晰)
4. 提示可能的误导性图表(如截断坐标轴夸大差异)

输出格式:
| 展示内容 | 推荐图表 | 理由 | 设计注意事项 |

约束:图表类型匹配数据特征;提示避免误导性设计(截断坐标轴、不当饼图等);散点图相关关系提示非因果。

质量标准:图表建议恰当,能准确传达结论,避免误导。

常见失败情况:用饼图展示过多类别;折线图连接无时间关系的数据;坐标轴截断夸大差异。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下图表建议是否存在以下问题:
1. 图表类型是否匹配数据特征(趋势用折线、对比用柱状)?
2. 是否提示了避免误导性设计(坐标轴截断、饼图类别过多)?
3. 散点图是否提示了相关不等于因果?

【粘贴图表建议】

逐条说明问题。
D. 返修优化版
根据自查意见修正图表建议。调整不匹配的图表类型,补充防误导提示,增加相关非因果提示。

原始图表建议:【粘贴原始内容】
自查意见:【粘贴自查结果】

8.5 交付给下游节点

将图表类型建议复制,交给节点 9(分析报告生成专家)。

8.6 人工验收清单

  • [ ] 图表类型是否匹配数据特征?
  • [ ] 是否提示了避免误导性设计?

节点 9:分析报告生成专家

9.1 节点定位

整合所有分析产出,生成完整的、可汇报的数据分析报告。报告要让读者清楚看到结论、依据和可靠性边界。

9.2 输入与输出

输入:节点 3 口径 + 节点 5 趋势 + 节点 6 对比 + 节点 7 结论 + 节点 8 图表

输出:完整分析报告

9.3 使用顺序

  1. 先用「快速生成版」生成报告。
  2. 正式汇报或对外报告时,改用「专家增强版」。
  3. 用「自查审稿版」检查报告是否如实、结论是否标注可靠性。
  4. 有问题则用「返修优化版」修正。
  5. 对照 9.6 验收清单确认。

9.4 提示词包

A. 快速生成版
你是一位分析报告撰写员。请整合内容为分析报告。

指标口径:【粘贴节点3】
趋势分析:【粘贴节点5】
分组对比:【粘贴节点6】
结论:【粘贴节点7】
图表建议:【粘贴节点8】

按"最终输出模板"生成报告。结论必须标注可靠性,数据不足处如实说明。
B. 专家增强版
你是一位专业数据分析报告撰写专家。

任务:整合所有分析,撰写可汇报、严谨的分析报告。

输入:
- 指标口径:【粘贴节点3】
- 数据质量:【粘贴节点2】
- 趋势分析:【粘贴节点5】
- 分组对比:【粘贴节点6】
- 分级结论:【粘贴节点7】
- 图表建议:【粘贴节点8】
- 分析目的:【填入】

报告结构:
1. 分析背景与目的
2. 数据说明(数据范围、口径、质量与局限)
3. 核心结论(先放确定结论,标注支撑)
4. 详细分析(趋势、对比,配图表建议)
5. 推测与待验证(标注为推测,说明不确定性)
6. 数据局限与无法回答的问题
7. 建议(如适用,基于确定结论,区分建议和决策)

约束(关键):
- 结论按确定性分级呈现,确定/推测/无法判断分开
- 数据局限单独说明,不掩盖
- 不编造数据和结论
- 不把相关说成因果
- 内容全部来自前序节点

质量标准:报告结论可靠、依据清晰、局限诚实,可直接用于汇报且经得起质疑。

常见失败情况:把推测和确定结论混在一起;隐藏数据局限;为报告"好看"夸大结论。
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下分析报告是否存在以下问题:
1. 确定结论、推测、无法判断是否分开呈现?
2. 数据局限是否单独说明(而非掩盖)?
3. 是否有编造的数据或结论?
4. 是否有把相关说成因果的表述?
5. 内容是否都来自前序分析(无新增编造)?

【粘贴分析报告】

逐条说明问题。
D. 返修优化版
根据自查意见修正分析报告。分开呈现结论等级,补充数据局限说明,删除编造内容,修正因果表述。

原始报告:【粘贴原始报告】
自查意见:【粘贴自查结果】

9.5 交付给下游节点

本节点是工作流终点。完整分析报告即最终交付物,可用于汇报。

9.6 人工验收清单

  • [ ] 确定结论、推测、无法判断是否分开呈现?
  • [ ] 数据局限是否单独说明?
  • [ ] 是否没有编造数据或结论?
  • [ ] 是否没有把相关说成因果?

节点交接说明

上游节点 交接内容 下游节点
节点 1 字段理解 字段含义清单 节点 2、节点 3
节点 2 质量检查 数据质量报告(含样本量) 节点 4
节点 3 口径校准 校准后的指标定义清单 节点 5、节点 6
节点 4 异常值识别 异常值清单 + 处理建议 节点 5
节点 5 趋势分析 趋势分析结果 节点 7
节点 6 分组对比 分组对比结果 节点 7
节点 7 结论提炼 分级结论 节点 8、节点 9
节点 8 图表建议 图表类型建议 节点 9
节点 9 报告生成 完整分析报告 最终输出模板

最终输出模板

【分析主题】数据分析报告

━━ 分析背景与目的 ━━
分析目的:【填入要回答的业务问题】

━━ 数据说明 ━━
数据范围:【时间范围、记录数】
关键指标口径:【列出指标及其定义、分子分母】
数据质量与局限:【缺失/样本量限制等】

━━ 核心结论(确定)━━
1.【结论】(数据支撑:【数据】)
2.【结论】(数据支撑:【数据】)

━━ 详细分析 ━━
趋势:【趋势描述 + 数据】(建议图表:【类型】)
对比:【对比结果 + 数据】(建议图表:【类型】)

━━ 推测与待验证 ━━
1.【推测】(指向性依据:【数据】;为何不确定:【原因】)

━━ 数据局限与无法回答的问题 ━━
1.【无法判断的问题】(需要什么数据才能回答:【说明】)

━━ 建议(如适用)━━
1.【基于确定结论的建议,供参考】

常见错误

错误 1:指标口径不清就开始分析

表现:分析"转化率"但没说清分子分母是什么,或对比两个时间段但口径不一致,结论看似合理实则错误。

修复:执行节点 3(招牌节点),先把每个指标的口径、分子分母、时间范围校准清楚,再做分析。

错误 2:把相关当因果

表现:"使用新功能的用户留存更高,所以新功能提升了留存"——但可能是活跃用户既爱用新功能又留存高,新功能未必是原因。

修复:节点 3 标注因果风险,节点 7 严格区分相关和因果,不下没有依据的因果结论。

错误 3:数据不足却硬凑结论

表现:样本只有几十条,或数据有大量缺失,但为了"给个交代"硬给出确定结论。

修复:节点 2 评估样本量,节点 7 对数据不足的问题诚实标注"无法判断",说明需要什么数据才能回答,绝不编造。


人工验收清单

  • [ ] 每个指标的口径(含分子分母、时间范围)是否校准清楚?
  • [ ] 结论是否区分了确定、推测、无法判断?
  • [ ] 是否没有把相关性说成因果?
  • [ ] 数据不足的问题是否诚实标注"无法判断",没有编造结论?
  • [ ] 数据局限是否在报告中如实说明?

延伸玩法

  • 变体 1:快速洞察版:对探索性分析,重点走节点 1(字段)→ 节点 3(口径)→ 节点 5/6(趋势对比)→ 节点 7(结论),快速得到初步洞察,省略报告生成。
  • 变体 2:数据质量体检版:专门走节点 1(字段)→ 节点 2(质量)→ 节点 4(异常值),输出数据质量报告,用于分析前的数据清理评估。
  • 进阶组合:与"工作流 17(领导汇报工作流)"结合,把分析报告的确定结论作为汇报的数据支撑;与"工作流 20(评论分析工作流)"结合,对文本数据先做结构化再用本工作流分析。