质量标准¶
本文件定义《AI 工作流图鉴》全书内容的质量评估标准,适用于所有工作流卡的生产、审查和修订环节。
一、合格线¶
每张工作流卡的质量评分必须达到 80 分(满分 100 分)才能进入正式目录。
低于 80 分的内容必须修改后重新评分。
二、评分维度(各 20 分)¶
维度 1:场景真实性(20 分)¶
评估内容是否基于真实工作场景,而非假设场景。
| 得分 | 标准 |
|---|---|
| 18-20 | 场景具体到"谁在什么情况下需要做什么",读者可以对号入座 |
| 12-17 | 场景有一定具体性,但部分描述仍然泛化 |
| 6-11 | 场景模糊,大多数职场人无法判断是否适用于自己 |
| 0-5 | 场景假设性过强,几乎不存在于真实工作中 |
一票否决项:场景描述使用"各种场景""所有人""任何情况"等无法操作的词语,直接扣至 0 分。
维度 2:节点完整性(20 分)¶
评估每个专家节点是否包含全部必要要素。
每个专家节点必须包含: 1. 节点名称 2. 职责(≤30 字) 3. 输入(来源明确) 4. 输出(格式明确) 5. 基础提示词 6. 进阶提示词 7. 审查提示词 8. 修正提示词 9. 验收标准(3-5 条是/否问题)
| 得分 | 标准 |
|---|---|
| 18-20 | 所有节点都有完整的 9 要素 |
| 12-17 | 多数节点完整,少数节点缺 1-2 个要素 |
| 6-11 | 部分节点缺少 3 个以上要素,或提示词类型不足 4 类 |
| 0-5 | 多数节点严重不完整 |
维度 3:提示词可用性(20 分)¶
评估提示词是否可以直接复制粘贴使用并得到有效输出。
| 得分 | 标准 |
|---|---|
| 18-20 | 所有提示词直接复制可用,无占位符,角色设定清晰,输出格式明确 |
| 12-17 | 多数提示词可直接使用,少数需要用户自行理解或补充 |
| 6-11 | 部分提示词有不可用的占位符或模糊指令 |
| 0-5 | 多数提示词需要大量修改才能使用 |
一票否决项:提示词中出现"【填入内容】""请描述你的需求"等让用户自行理解的占位符(示例模板除外),直接扣至 0 分。
维度 4:交接清晰度(20 分)¶
评估节点间的输入输出交接是否明确、无歧义。
| 得分 | 标准 |
|---|---|
| 18-20 | 每个节点明确说明"输入来自哪个节点的哪个输出",节点交接表完整 |
| 12-17 | 多数节点交接清晰,少数节点输入来源不明确 |
| 6-11 | 节点交接说明笼统,或存在信息断层 |
| 0-5 | 基本没有节点交接说明 |
维度 5:验收可操作性(20 分)¶
评估验收清单是否能被非专业人员理解和执行。
| 得分 | 标准 |
|---|---|
| 18-20 | 所有验收条目都是可判断的是/否问题,不需要专业判断 |
| 12-17 | 多数条目可操作,少数条目需要一定经验才能判断 |
| 6-11 | 部分条目模糊,需要较强的专业判断 |
| 0-5 | 验收条目基本不可操作(例如"质量是否足够好") |
三、内容硬性禁止项¶
以下任意一项出现,需要强制修改(不影响评分,但不修改不允许发布):
- [ ] 出现禁用词:赋能、智能化、提升效率、一键生成、强大的 AI、革命性
- [ ] 出现 AI 腔:首先其次最后排比、"值得注意的是"、"希望本文对你有帮助"
- [ ] 最终输出模板缺失
- [ ] 人工验收清单缺失
- [ ] 代码块未正确闭合
- [ ] 工作流没有明确的最终交付物
四、使用方式¶
生产阶段:生成工作流卡后,用 prompts/quality-check.md 里的提示词对 AI 输出进行评分。
修订阶段:根据评分结果,按照"得分最低的维度优先修改"原则迭代。
冻结条件:连续两次评分均达到 80 分以上,且所有硬性禁止项清零,则该工作流卡可以冻结归档。