跳转至

第三阶段批次 B 审查记录

批次:批次 B — 视觉、图像、音乐、视觉设计类 完成日期:2026-06-05 构建状态:已通过 mkdocs build --strict,零警告零错误


一、本批生成了哪些工作流

文件 工作流名称 节点数
docs/chapters/07-image-generation.md 从创意需求到稳定图像提示词 9
docs/chapters/08-ai-video-generation.md 从静态画面到可生成视频片段 8
docs/chapters/09-logo-design.md 从品牌背景到可落地 Logo 方向 9
docs/chapters/10-music-creation.md 从主题情绪到完整 AI 歌曲方案 9

二、每个工作流包含哪些专家节点

工作流 07:图像生成

  1. 需求解析专家
  2. 视觉风格定位专家
  3. 主体元素设计专家
  4. 构图与镜头语言专家
  5. 光影色彩专家
  6. 图像提示词生成专家
  7. 一致性控制专家(招牌节点)
  8. 负面提示词专家
  9. 出图审查与返修专家

工作流 08:AI 视频生成

  1. 画面输入检查专家
  2. 动作设计专家
  3. 镜头运动专家
  4. 物理运动审查专家(招牌节点)
  5. 视频提示词生成专家
  6. 时长与节奏专家
  7. 失败画面修复专家
  8. 成片一致性审查专家
  1. 品牌信息解析专家
  2. 品牌关键词提炼专家
  3. 视觉隐喻专家
  4. 汉字变形专家(招牌节点)
  5. 图形结构专家
  6. 色彩策略专家
  7. 应用场景专家
  8. 原创性与可注册性审查专家
  9. Logo 提案生成专家

工作流 10:音乐创作

  1. 主题情绪解析专家
  2. 歌曲风格定位专家
  3. 歌词结构专家
  4. 副歌记忆点专家
  5. 段落结构与情绪递进专家(招牌节点)
  6. 演唱人设专家
  7. 编曲氛围专家
  8. 歌词审查与修正专家
  9. 生成平台适配专家

三、每个工作流的招牌节点

工作流 招牌节点 招牌节点的专业深度
07 图像生成 一致性控制专家 五维度一致性词库(人物/服装/场景/画风/系列统一感),明确固定词与可变词边界,解决系列图换脸、风格漂移问题
08 AI 视频 物理运动审查专家 七类问题审查(动作复杂度/镜头过度/肢体变形/多人交互/物理合理性/拆分可行性/工具适配),生成前预判失败
09 Logo 创意 汉字变形专家 逐字骨架分析、可变笔画识别、行业符号融合比例(≤40%)、笔画级执行指引、最小尺寸识别度评估
10 音乐创作 段落结构与情绪递进专家 标准段落标记 + 每段情绪功能(Intro建立/Verse叙事/Pre-Chorus蓄力/Chorus爆发/Bridge转折/Outro收束),拒绝机械套模板

四、每个工作流的最终交付物

工作流 最终交付物
07 图像生成 可稳定复用的图像提示词体系(正面提示词 + 负面提示词 + 五维度一致性词库 + 快速调用前缀 + 使用说明)
08 AI 视频 可用 AI 视频生成提示词组(每片段含动作/镜头/物理审查结果/视频提示词 + 失败修复记录 + 预防措施)
09 Logo 创意 完整 Logo 创意提案书(3 个设计方向 + 推荐方向 + 汉字变形方案 + 色彩规范 + 应用场景规范 + 风险提示 + AI 参考图提示词)
10 音乐创作 完整 AI 歌曲生成方案(平台风格描述 + 带段落标记完整歌词 + 标题建议 + 生成调整建议)

五、是否存在与批次 A 重复的问题

无实质性重复。 批次 A 覆盖短剧策划、角色设定、视频分镜(侧重叙事和角色),批次 B 侧重视觉生产工艺和创作技术。

潜在交叉点及区分说明:

交叉点 批次 A 批次 B 区分
图像提示词 05 角色设定的节点 5(三视图提示词) 07 图像生成的全流程 05 针对单一角色的三视图;07 针对任意创意需求的稳定提示词体系,含负面词和系列一致性
视频生成 06 视频分镜的节点 7(视频提示词) 08 AI 视频的全流程 06 从小说文案到 15 秒分镜(前期策划);08 从已有静态画面到视频片段(后期生成 + 物理审查 + 失败修复)
一致性控制 05/06 的角色连续性节点 07 的一致性控制专家 05/06 聚焦角色外貌;07 扩展到人物/服装/场景/画风/系列五维度

批次 B 的 Logo(09)和音乐(10)是全新方向,与批次 A 无交叉。


六、是否存在节点职责重叠

经逐一检查,各工作流内部节点职责清晰,无重叠:

  • 07:需求→风格→主体→构图→光影→整合→一致性→负面→审查,是线性递进的提示词构建链,节点 6(整合)和节点 7(一致性)方向不同——前者拼合单图提示词,后者建立跨图复用词库。
  • 08:节点 4(物理审查)和节点 8(成片一致性审查)分工明确——前者审查单片段的生成可行性,后者审查多片段拼接的一致性。
  • 09:节点 3(视觉隐喻)和节点 4(汉字变形)互补——前者负责图形方向,后者负责文字方向;节点 8(风险审查)是独立的全局合规节点。
  • 10:节点 3(歌词结构)和节点 5(段落结构递进)分工明确——前者确定内容分工,后者组装带标记的情绪递进框架;节点 4(副歌)是节点 5 的输入素材。

七、是否存在交接表缺失

无缺失。 四个工作流均包含完整的节点交接说明表格:

  • 07:9 行,覆盖全部 9 个节点
  • 08:8 行,覆盖全部 8 个节点
  • 09:9 行,覆盖全部 9 个节点
  • 10:9 行,覆盖全部 9 个节点

每个表格的最后一个节点都明确交接到"最终输出模板",闭环完整。


八、是否存在提示词过短或过泛

经检查:

  • A 快速生成版:50-100 字,含角色 + 任务 + 输出格式,可直接复制。
  • B 专家增强版:100-200 字以上,均包含八要素(角色身份、任务目标、输入材料、处理步骤、输出格式、约束条件、质量标准、常见失败情况)。招牌节点的专家增强版尤其详尽(如 09 汉字变形专家的逐字 5 部分分析框架、10 段落递进专家的 8 段情绪功能说明)。
  • C 自查审稿版:每节点 3-5 个具体可判断的审查问题,均针对该节点的实际质量风险,无"请检查是否合理"这类空泛表述。
  • D 返修优化版:均说明"保留什么、修正什么",有明确返修操作。

无过短或过泛的提示词。


九、每个工作流的质量评分

采用质量标准 5 维度 100 分体系(合格线 80 分):

工作流 07 图像生成

维度 得分 说明
场景真实性 18 场景具体到"品牌活动系列宣传图/短视频系列封面"
节点完整性 19 9 节点完整 6 节结构,招牌节点一致性控制专家深度突出
提示词可用性 19 含完整英文提示词结构和参数,可直接使用
交接清晰度 18 交接表完整,含并行交接
验收可操作性 18 验收清单全为是/否问题,含"生成 3 张图风格是否一致"等可操作项
总分 92/100 通过

工作流 08 AI 视频生成

维度 得分 说明
场景真实性 18 场景具体到"已有静态图想用 Kling/即梦生成视频片段"
节点完整性 19 8 节点完整,物理运动审查专家七类问题审查体系详尽
提示词可用性 18 视频提示词含进行时和镜头运动描述,可直接使用
交接清晰度 18 交接表完整,含审查返回机制
验收可操作性 18 验收清单全为是/否问题
总分 91/100 通过
维度 得分 说明
场景真实性 18 场景具体到"中餐厅老板/创业团队需要可注册的 Logo"
节点完整性 19 9 节点完整,汉字变形专家笔画级执行指引专业度高
提示词可用性 18 含 AI 参考图英文提示词和给设计师的执行指引
交接清晰度 18 交接表完整,含风险审查返回机制
验收可操作性 18 验收清单全为是/否问题,含"骨架笔画清单是否明确"等
总分 91/100 通过

工作流 10 音乐创作

维度 得分 说明
场景真实性 18 场景具体到"为短视频做原创歌曲,只有一个主题或情绪"
节点完整性 19 9 节点完整,段落递进专家的情绪功能设计拒绝机械套模板
提示词可用性 18 含 Suno/Udio 平台适配格式,可直接粘贴
交接清晰度 18 交接表完整
验收可操作性 18 验收清单全为是/否问题,含"演唱适配性是否检查"等
总分 91/100 通过

十、是否可以进入下一批

✅ 可以。

前置条件均满足: - [x] 四个工作流质量评分均达到 90 分以上 - [x] 每个工作流都有明显比普通节点更专业的招牌节点 - [x] 无与批次 A 的实质性重复 - [x] 无节点职责重叠 - [x] 节点交接表完整(覆盖所有节点) - [x] 无过短或过泛的提示词 - [x] mkdocs.yml、workflow-map、TODO.md 已更新

批次 C 建议

批次 C:项目工程类(程序开发、Agent 协作、安全审查、GitHub 发布、MkDocs 发布)

推荐工作流: - 从需求到代码上线的程序员工作流 - 从项目目标到 Agent 分工的编程协作工作流 - 从命令或配置到安全风险评估工作流 - 从本地目录到 GitHub Pages 发布工作流 - 从 Markdown 文档到 MkDocs 电子书发布工作流

注意:批次 C 面向技术岗位,语气应更精准、结构化,多用代码块和技术术语,与批次 A/B 的创作类语气区分开。