工作流 06：从小说文案到 15 秒电影级分镜脚本的 AI 多专家工作流¶

适用岗位：AI 视频创作者、Seedance/即梦用户、短片导演、小说改编视频创作者

真实场景：你有一段小说文字或故事文案（100-300 字），想用 AI 视频工具（Seedance、即梦、Kling）生成一段 15 秒的电影级短片，但不知道如何把文字转化成每个镜头都有明确提示词的分镜脚本。

最终目标：完整的 15 秒分镜脚本，包含：场景拆分方案、每个分镜的镜头设计、角色连续性描述词库、每个分镜的图像提示词和视频提示词（英文）、配音文案和字幕方案。

输入材料清单¶

开始前请准备以下材料：

原始小说文案或故事文字（100-300 字，一段完整的情节片段）
主角外貌描述（可选，已有角色设定则直接使用）
目标视觉风格（写实电影感 / 古风水墨 / 科幻赛博 / 动漫风格）
目标工具（Seedance / 即梦 / Kling / Sora，影响提示词格式）
是否需要配音（是/否，影响配音文案节点是否执行）

工作流总览¶

节点 1：原文解析专家
  ↓ 输出：核心情绪 + 场景要素 + 人物动作清单
节点 2：情绪节奏专家
  ↓ 输出：15秒情绪弧线 + 高潮时间点设计
节点 3：场景拆分专家
  ↓ 输出：4-6个场景段落（每段约2-4秒）
节点 4：镜头设计专家
  ↓ 输出：每个场景的景别/运动/切换方式
节点 5：角色连续性专家
  ↓ 输出：角色一致性描述词库
节点 6：画面提示词专家
  ↓ 输出：每个分镜的图像生成提示词（英文）
节点 7：视频提示词专家
  ↓ 输出：每个分镜的视频生成提示词（英文）
节点 8：配音字幕专家
  ↓ 输出：15秒配音文案 + 字幕方案
节点 9：成片审查专家（跨内容全局审查）
  ↓ 输出：成片审查报告 + 修改建议
最终交付：完整15秒分镜脚本包

专家节点详解¶

每个节点包含六部分：节点定位、输入与输出、使用顺序、提示词包（A 快速 / B 专家 / C 自查 / D 返修）、交付给下游节点、人工验收清单。

关于节点 9（成片审查专家）：这是一个跨内容的全局审查节点，负责检查所有分镜的连贯性、角色一致性和总时长匹配，性质与其他节点的自查审稿版不同——它是对整套分镜脚本进行系统性验收的独立节点。

其他节点的 C 自查审稿版和 D 返修优化版是当前节点内部的工作模式，不是新的专家角色。

节点 1：原文解析专家¶

1.1 节点定位¶

从原始小说文案中提取可视化的核心元素：主要情绪、关键场景、人物动作和环境细节。原文是文字思维，视频是画面思维，这个节点完成从文字到画面的第一次转化。

1.2 输入与输出¶

输入：原始小说文案（100-300 字）

输出：情绪标签（主情绪 + 情绪变化点）+ 场景要素清单（地点/时间/天气/光线）+ 人物动作清单（关键行为）+ 可视化细节清单

1.3 使用顺序¶

先用「快速生成版」得到解析结果初稿。
原文含有隐喻或意象较多时，改用「专家增强版」。
用「自查审稿版」检查提取的元素是否都能被画面呈现。
有问题则用「返修优化版」修正。
对照 1.6 验收清单确认，通过后交给节点 2。

1.4 提示词包¶

A. 快速生成版¶

你是一位视频分镜师。请从以下小说文案中提取可视化元素。

原始文案：【粘贴小说文案】

输出：
1. 主情绪标签（一个词，例如：悲伤/热烈/压抑/爽快）
2. 情绪变化点（文案中情绪发生转变的位置，一句话说明）
3. 关键场景要素（地点、时间、天气、光线条件）
4. 人物核心动作（3-5个关键行为，每条一句话）
5. 可视化细节（可以成为画面亮点的具体细节描写）

B. 专家增强版¶

你是一位资深影视分镜导演，擅长将文学语言转化为画面语言。

任务：对以下小说文案进行深度视觉化解析，提取所有能被镜头捕捉的元素，剔除无法画面化的纯心理描述。

输入：
- 原始文案：【粘贴小说文案】

解析维度：
1. 情绪弧线（文案开始/中间/结尾各处的情绪标签，构成情绪走向）
2. 空间层次（近景元素/中景元素/远景元素，立体还原场景）
3. 时间线索（白天/夜晚/光线角度，精确到时间段）
4. 动作序列（人物动作按先后顺序排列，每个动作的力度和速度）
5. 视觉焦点（哪些细节在画面中应该被强调，哪些是背景）
6. 无法画面化的内容（心理活动、叙述者视角等，标注为"旁白素材"）

约束：所有提取结果必须是可以被摄影机捕捉的画面元素，心理描述必须转化为外化行为或单独标注为旁白。

输出：6个维度的结构化解析报告

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下原文解析是否存在以下问题：
1. 是否有纯心理描写被当作画面元素提取（无法被摄影机捕捉的内容）？
2. 场景要素是否足够具体（不能只写"室外"，需要说明具体环境）？
3. 人物动作是否是可执行的具体行为（不能只写"他很痛苦"）？
4. 情绪变化点是否有对应的可视化行为或环境变化支撑？

【粘贴原文解析内容】

逐条说明问题。

D. 返修优化版¶

根据自查意见修改原文解析。将心理描写转化为外化行为或标注为旁白，具体化模糊的场景要素，补充情绪变化点的视觉支撑。

原始解析：【粘贴原始解析结果】
自查意见：【粘贴自查结果】

1.5 交付给下游节点¶

将解析结果（情绪标签 + 场景要素 + 动作清单 + 可视化细节）完整复制，交给节点 2（情绪节奏专家）。节点 2 将基于情绪弧线设计 15 秒内的节奏方案。

1.6 人工验收清单¶

[ ] 所有提取的元素是否都可以被摄影机捕捉（无纯心理描写）？
[ ] 是否标注了情绪变化的具体位置？
[ ] 场景要素是否包含了地点、时间、光线三个维度？

节点 2：情绪节奏专家¶

2.1 节点定位¶

将原文的情绪弧线压缩到 15 秒内，设计情绪起伏的节拍时间点和高潮位置。15 秒内节奏设计的核心挑战是：既要让观众感受到情绪变化，又不能因为节奏太密导致视觉疲劳。这个节点是本工作流区别于普通分镜工作流的核心差异点。

2.2 输入与输出¶

输入：节点 1 的情绪标签和情绪变化点

输出：15 秒情绪弧线时间表（每个时间节点的情绪状态）+ 高潮时间点 + 每段时长建议

2.3 使用顺序¶

先用「快速生成版」得到情绪节奏初稿。
需要精细控制节奏的情绪场景时，改用「专家增强版」。
用「自查审稿版」检查情绪节拍是否合理、高潮位置是否有效。
有问题则用「返修优化版」调整。
对照 2.6 验收清单确认，通过后交给节点 3。

2.4 提示词包¶

A. 快速生成版¶

你是一位视频节奏设计师。请根据以下情绪分析，设计15秒视频的情绪节奏方案。

情绪标签：【粘贴节点1的情绪弧线分析】

输出：
1. 15秒情绪节奏表（每3-4秒一个情绪节点，标注情绪状态）
2. 高潮时间点（情绪最强烈的时刻在第几秒）
3. 开头和结尾的情绪定调
4. 每个情绪段落的建议时长（秒）

B. 专家增强版¶

你是一位专注于短视频情绪设计的剪辑师和导演，深度研究过15秒内制造情绪共鸣的节奏规律。

任务：将以下情绪弧线压缩为15秒内的精确节奏设计，确保情绪起伏清晰可感，同时节奏不过分密集。

输入：
- 情绪弧线分析：【粘贴节点1的完整情绪分析】
- 目标视觉风格：【填入风格，影响节奏基调】

设计原则：
- 0-3秒：情绪建立段（建立基础情绪状态，不能平淡但也不能立即进入最高强度）
- 4-10秒：情绪发展段（情绪主体内容，有1-2次明显的强度变化）
- 11-13秒：情绪高潮段（最强烈的情绪时刻，视觉和音乐配合达到顶点）
- 14-15秒：情绪余韵（一个让情绪慢慢落下或留有余味的收尾画面）

约束：高潮段必须在第11-13秒，不能在最后一秒（没有余韵）也不能在第5秒（后续太平淡）。

输出：精确到秒的情绪节奏表（时间轴格式）+ 每段建议镜头数量 + 高潮段情绪强化建议

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下情绪节奏设计是否存在以下问题：
1. 高潮时间点是否在第11-13秒区间，而不是在最后一秒或前五秒？
2. 是否有连续5秒以上情绪强度几乎没有变化的平淡段落？
3. 开头3秒是否有足够的情绪建立，而不是完全平铺直叙？
4. 结尾是否有情绪余韵设计，而不是戛然而止？

【粘贴情绪节奏设计内容】

逐条说明问题。

D. 返修优化版¶

根据自查意见调整情绪节奏设计。修正高潮位置，填补平淡段落，强化开头情绪建立，补充结尾余韵设计。

原始设计：【粘贴原始节奏设计】
自查意见：【粘贴自查结果】

2.5 交付给下游节点¶

将情绪节奏时间表（含每段时长建议）完整复制，交给节点 3（场景拆分专家）。节点 3 将根据时长建议将文案拆分为对应时长的场景段落。

2.6 人工验收清单¶

[ ] 情绪高潮是否在第 11-13 秒区间内？
[ ] 是否有明确的结尾余韵设计（不是戛然而止）？
[ ] 每个情绪段落的时长是否合理（没有 5 秒以上的平淡段）？

节点 3：场景拆分专家¶

3.1 节点定位¶

将原始文案按照情绪节奏时间表拆分为 4-6 个可拍摄的场景段落，每个场景段落对应一段固定时长。场景拆分决定了每个镜头的内容边界，是后续镜头设计和提示词生成的直接输入。

3.2 输入与输出¶

输入：节点 1 原文解析（场景要素 + 动作清单）+ 节点 2 情绪节奏时间表

输出：4-6 个场景段落（每段：时间区间 + 场景描述 + 核心动作 + 情绪标注）

3.3 使用顺序¶

先用「快速生成版」得到场景拆分初稿。
场景切换较多或原文节奏复杂时，改用「专家增强版」。
用「自查审稿版」检查场景时长和内容量是否匹配。
有问题则用「返修优化版」调整。
对照 3.6 验收清单确认，通过后交给节点 4。

3.4 提示词包¶

A. 快速生成版¶

你是一位视频分镜师。请将以下文案按照情绪节奏时间表拆分为场景段落。

原文解析：【粘贴节点1的场景要素和动作清单】
情绪节奏时间表：【粘贴节点2的时间表】

输出（每个场景段落）：
场景X：[时间区间] | [地点和环境] | [核心动作描述] | [情绪标注]
（共4-6个场景）

B. 专家增强版¶

你是一位影视分镜导演，擅长将短小文案转化为节奏精准的场景拆分方案。

任务：按照以下情绪节奏时间表，将文案内容拆分为场景段落，确保每段的内容量与时长匹配。

输入：
- 原文解析结果：【粘贴节点1的完整解析】
- 情绪节奏时间表：【粘贴节点2的时间表（精确到秒）】

拆分原则：
1. 每个场景段落的时长与情绪节奏时间表对应
2. 场景切换时机与情绪变化点对齐（情绪转折处切场景）
3. 情绪高潮段保持单一场景，不要在高潮处切换场景
4. 每段的内容量评估（2秒的场景不能有超过1个核心动作）

每个场景段落必须包含：
- 精确时间区间（例如：0:00-0:03）
- 场景环境（空间描述+光线条件）
- 核心动作（该段内发生的主要视觉事件）
- 情绪强度（1-5分，对应情绪节奏时间表）
- 镜头数量建议（该段建议用几个镜头完成）

约束：4-6个场景总时长必须精确等于15秒。

输出：场景拆分表格（含5个维度）+ 场景切换逻辑说明

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下场景拆分是否存在以下问题：
1. 所有场景段落时长加总是否精确等于15秒？
2. 是否有单个场景时长只有1秒但包含超过1个核心动作（来不及呈现）？
3. 情绪高潮段是否保持了单一场景，没有在高潮处切换场景？
4. 场景切换点是否与情绪变化点对齐？

【粘贴场景拆分内容】

逐条说明问题。

D. 返修优化版¶

根据自查意见调整场景拆分。修正总时长，压缩过度的场景内容量，对齐情绪变化点和场景切换点。

原始拆分：【粘贴原始场景拆分】
自查意见：【粘贴自查结果】

3.5 交付给下游节点¶

将场景拆分表格（含时间区间、环境描述、核心动作、情绪强度）完整复制，同时交给： - 节点 4（镜头设计专家）：用于设计每个场景的具体镜头语言。 - 节点 5（角色连续性专家）：了解角色在不同场景中的外貌需求。

3.6 人工验收清单¶

[ ] 所有场景段落时长加总是否精确等于 15 秒？
[ ] 情绪高潮段是否保持单一场景，没有在高潮处切换？
[ ] 每个场景的内容量是否与时长匹配（不超载也不空洞）？

节点 4：镜头设计专家¶

4.1 节点定位¶

为每个场景段落设计具体的镜头语言：景别选择、镜头运动方式和场景切换方式。镜头设计是从"拍什么"到"怎么拍"的转化，直接决定画面提示词和视频提示词的核心参数。

4.2 输入与输出¶

输入：节点 3 的场景拆分表格

输出：每个场景的镜头设计方案（景别 + 镜头运动 + 切换方式 + 构图重点）

4.3 使用顺序¶

先用「快速生成版」得到镜头设计初稿。
需要精确控制情绪强化效果时，改用「专家增强版」。
用「自查审稿版」检查景别变化和情绪匹配。
有问题则用「返修优化版」调整。
对照 4.6 验收清单确认，通过后同时交给节点 5、6、7。

4.4 提示词包¶

A. 快速生成版¶

你是一位分镜导演。请根据以下场景拆分，设计每个场景的镜头方案。

场景拆分：【粘贴节点3的场景表格】

每个场景输出：
景别（远景/全景/中景/近景/特写）
镜头运动（固定/推/拉/横移/跟拍）
切换方式（与上一场景：硬切/淡入/转场）
构图重点（画面焦点在哪里）

B. 专家增强版¶

你是一位电影级短片导演，专注于用有限镜头数量制造最大情绪冲击。

任务：为以下场景拆分设计精确的镜头语言，确保镜头设计强化情绪节奏，而不是随机选择。

输入：
- 场景拆分表格：【粘贴节点3的完整拆分】
- 情绪节奏时间表：【粘贴节点2的时间表，了解每段情绪强度】

设计原则：
- 情绪建立段（0-3秒）：全景或中景建立空间感，固定或缓慢推进的镜头
- 情绪发展段（4-10秒）：随情绪升高逐渐靠近，切换频率可以加快
- 情绪高潮段（11-13秒）：特写或极近景，推镜头或跟拍强化情绪
- 情绪余韵段（14-15秒）：拉镜或固定远景，留出画面呼吸感

约束：相邻镜头景别变化不能超过2级（全景不能直接切特写）；情绪高潮段不能用固定长镜头。

输出：每个场景的镜头设计卡（景别/运动/切换/构图/情绪匹配说明）

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下镜头设计是否存在以下问题：
1. 情绪高潮段是否使用了推镜或特写，而不是固定远景？
2. 相邻镜头景别变化是否超过2级（例如全景直接切特写）？
3. 是否有连续3个以上相同景别，缺少视觉变化？
4. 余韵段是否有足够的画面呼吸感（不能是快速切换的多镜头）？

【粘贴镜头设计内容】

逐条说明问题。

D. 返修优化版¶

根据自查意见调整镜头设计。修正高潮段镜头不足，补充景别变化，拉开相邻镜头景别差距，为余韵段增加呼吸空间。

原始设计：【粘贴原始镜头设计】
自查意见：【粘贴自查结果】

4.5 交付给下游节点¶

将镜头设计方案完整复制，同时交给： - 节点 5（角色连续性专家）：了解每个场景中角色的构图位置。 - 节点 6（画面提示词专家）：作为图像提示词中的镜头参数来源。 - 节点 7（视频提示词专家）：作为视频运动描述的直接依据。

4.6 人工验收清单¶

[ ] 情绪高潮段是否使用了推镜或特写，而非固定远景？
[ ] 相邻镜头景别变化是否不超过 2 级？
[ ] 是否没有连续 3 个以上相同景别？

节点 5：角色连续性专家¶

5.1 节点定位¶

在分镜开始生成提示词之前，建立角色的一致性描述词库，确保角色在所有分镜中外貌保持一致。这是本工作流中的关键质量控制节点——如果跳过这一步，AI 生成的视频中同一个人物在不同镜头里会"换脸"。

5.2 输入与输出¶

输入：主角外貌描述（来自输入材料或来自工作流 05 的角色设定文档）+ 节点 3 场景拆分（了解场景中的着装需求）

输出：角色一致性描述词库（固定外貌词组 + 场景可变词 + 快速调用卡）

5.3 使用顺序¶

先用「快速生成版」得到词库初稿。
有多个角色或角色在场景中有服装变化时，改用「专家增强版」。
用「自查审稿版」检查词库是否足够精确、可变词是否清晰。
有问题则用「返修优化版」修正。
对照 5.6 验收清单确认，通过后同时交给节点 6 和节点 7。

5.4 提示词包¶

A. 快速生成版¶

你是一位AI绘图提示词工程师。请根据以下角色描述，建立角色一致性描述词库。

角色外貌描述：【填入主角外貌描述，或粘贴工作流05的角色设定输出】
场景列表：【粘贴节点3的场景环境描述摘要】

输出：
1. 固定外貌词组（每次生成该角色时必须包含的英文词汇）
2. 场景可变词（根据场景可以替换的服装/背景词汇）
3. 快速调用卡（30字以内的核心描述词，适合添加到任何提示词前）

B. 专家增强版¶

你是一位专注于AI视频角色连续性的提示词工程师。

任务：为以下角色建立精确的一致性描述词库，确保在所有分镜的图像和视频提示词中，同一角色的外貌始终一致。

输入：
- 角色外貌描述：【填入主角描述或粘贴工作流05输出】
- 场景拆分（了解各场景的外貌需求）：【粘贴节点3的场景描述】

词库结构：
1. 固定词（所有场景必须包含）：面部特征词 + 发型发色词 + 体型词 + 肤色词
   格式：英文词汇，用逗号分隔，总长度不超过50个词
2. 半固定词（通常包含，可根据剧情调整）：标志性服装元素 + 特定道具
3. 可变词（根据场景替换）：具体场景服装 + 背景 + 光线
4. 负面词（防止AI生成错误外貌）：该角色不能出现的外貌特征

特别要求：
- 如有多个角色，为每个角色提供独立词库，并标注区分关键词
- 固定词必须是Midjourney/SD可以理解的标准词汇，不能用中文或自造词

输出：角色词库表格（4个维度）+ 快速调用卡

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下角色一致性词库是否存在以下问题：
1. 固定词是否足够简洁精确（过长会压缩其他描述词的权重）？
2. 固定词是否包含了最能区分该角色的外貌特征（发色、眼睛等）？
3. 可变词和固定词之间是否存在矛盾（例如固定词有long hair，可变词又改了发型）？
4. 是否包含了负面词，防止常见的AI外貌生成错误？

【粘贴角色一致性词库】

逐条说明问题。

D. 返修优化版¶

根据自查意见精炼词库。压缩过长的固定词，突出区分性特征，消除固定词和可变词的矛盾，补充负面词。

原始词库：【粘贴原始词库】
自查意见：【粘贴自查结果】

5.5 交付给下游节点¶

将角色一致性词库（固定词 + 快速调用卡）完整复制，同时交给： - 节点 6（画面提示词专家）：在每个图像提示词中加入固定词。 - 节点 7（视频提示词专家）：在每个视频提示词中加入固定词。

5.6 人工验收清单¶

[ ] 固定词是否包含了最能区分角色的外貌特征（发色、眼睛颜色等）？
[ ] 固定词和可变词之间是否没有矛盾？
[ ] 是否包含了防止常见生成错误的负面词？

节点 6：画面提示词专家¶

6.1 节点定位¶

为每个分镜生成可直接用于 Midjourney/Stable Diffusion/即梦的图像提示词。图像是视频生成的参考基础，图像提示词的质量直接影响最终视频的画面质量。

6.2 输入与输出¶

输入：节点 3 场景拆分 + 节点 4 镜头设计 + 节点 5 角色一致性词库

输出：每个分镜的完整英文图像提示词（含角色固定词 + 场景描述 + 镜头参数 + 风格标签）

6.3 使用顺序¶

先用「快速生成版」得到图像提示词初稿。
需要精确的风格一致性或特殊光线处理时，改用「专家增强版」。
用「自查审稿版」检查角色固定词是否一致、参数是否完整。
有问题则用「返修优化版」修正。
对照 6.6 验收清单确认，通过后交给节点 7。

6.4 提示词包¶

A. 快速生成版¶

你是一位AI图像提示词工程师。请为以下分镜生成图像提示词。

场景拆分：【粘贴节点3的场景表格（选择一个场景）】
镜头设计：【粘贴节点4该场景的镜头设计】
角色固定词：【粘贴节点5的快速调用卡】
目标工具：【填入Midjourney v6 / Stable Diffusion】
视觉风格：【填入风格】

提示词格式：
[角色固定词], [动作描述], [场景/背景], [光线], [镜头参数], [风格标签], [质量标签], [画幅参数]

B. 专家增强版¶

你是一位AI图像提示词工程师，专注于电影级分镜图像生成。

任务：为以下所有分镜生成完整的图像提示词，确保风格统一、角色一致、光线匹配情绪。

输入：
- 所有场景拆分：【粘贴节点3的完整表格】
- 镜头设计：【粘贴节点4的完整设计】
- 角色一致性词库：【粘贴节点5的固定词 + 快速调用卡】
- 视觉风格：【填入风格，例如：cinematic film noir / warm golden hour / cold blue atmosphere】

提示词结构（每个分镜）：
[角色固定词（每张图必须完全相同）], [当前姿势/动作], [场景环境描述], [光线处理（匹配情绪强度）], [景别和构图（来自节点4）], [视觉风格标签], [质量标签：masterpiece, best quality, ultra detailed], [参数：--ar 9:16 --v 6（Midjourney）]

情绪高潮分镜的光线处理：
- 强烈情绪（悲伤/愤怒/爱）：强对比光/逆光/暖色调聚光
- 平静情绪：散射柔光/自然环境光
- 神秘/紧张：冷色调/阴影覆盖面部/局部照明

约束：每个分镜的角色固定词必须完全一致（复制粘贴，不能改写）。

输出：所有分镜的图像提示词列表（编号 + 完整英文提示词）

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下图像提示词是否存在以下问题：
1. 所有分镜中角色固定词是否完全相同（一字不差）？
2. 情绪高潮分镜的光线处理是否与情绪强度匹配（高强度情绪不能用平淡柔光）？
3. 是否每个提示词都包含了景别/构图描述（来自镜头设计）？
4. 是否所有提示词都包含了画幅参数（--ar 9:16 或对应参数）？

【粘贴图像提示词列表】

逐条说明问题。

D. 返修优化版¶

根据自查意见修正图像提示词。统一角色固定词，调整情绪高潮的光线处理，补充缺失的镜头参数和画幅参数。

原始提示词：【粘贴原始提示词列表】
自查意见：【粘贴自查结果】
角色固定词（统一版）：【粘贴节点5的固定词】

6.5 交付给下游节点¶

将所有分镜的图像提示词列表（编号 + 完整英文提示词）复制，交给节点 7（视频提示词专家）参考。节点 7 将基于图像提示词的场景描述，加入运动描述生成视频提示词。

6.6 人工验收清单¶

[ ] 所有分镜的角色固定词是否完全一致（可以逐字对比验证）？
[ ] 情绪高潮分镜的光线处理是否比其他段落更强烈？
[ ] 是否每个提示词都包含了景别参数和画幅参数？

节点 7：视频提示词专家¶

7.1 节点定位¶

将分镜的静态描述转化为适合 Seedance/即梦/Kling 等 AI 视频工具的动态提示词，重点描述每个分镜从开始到结束的画面运动过程。视频提示词与图像提示词的核心区别是：视频提示词必须描述运动，而不是静止构图。

7.2 输入与输出¶

输入：节点 4 镜头设计 + 节点 5 角色固定词 + 节点 6 图像提示词（参考场景描述）

输出：每个分镜的视频生成提示词（英文，含场景、运动过程、镜头方向、时长、风格）

7.3 使用顺序¶

先用「快速生成版」得到视频提示词初稿。
需要更精确的运动描述或针对特定工具优化时，改用「专家增强版」。
用「自查审稿版」检查运动描述完整性和时长合理性。
有问题则用「返修优化版」修正。
对照 7.6 验收清单确认，通过后交给节点 8 和节点 9。

7.4 提示词包¶

A. 快速生成版¶

你是一位AI视频提示词工程师。请为以下分镜生成视频提示词（适用于Seedance/即梦/Kling）。

分镜信息（一个场景）：
- 场景描述：【粘贴节点3的场景环境】
- 镜头运动：【粘贴节点4的运动设计】
- 角色固定词：【粘贴节点5的快速调用卡】
- 时长：【填入该段秒数】

提示词格式：
[场景描述], [人物动作], [镜头运动方向], [时长] seconds, [风格], [光线]
示例：A young woman stands in the rain, slowly raises her head to look at the sky, camera gently pushes in from medium shot to close-up, 3 seconds, cinematic, soft blue cold light

B. 专家增强版¶

你是一位AI视频导演，专注于用Seedance/即梦/Kling生成电影级短视频。

任务：为以下所有分镜生成完整的视频生成提示词，重点描述每段画面的运动过程，确保连接后形成连贯的15秒短片。

输入：
- 场景拆分（含时长）：【粘贴节点3的完整表格】
- 镜头设计（含运动方式）：【粘贴节点4的完整设计】
- 角色固定词：【粘贴节点5的固定词】
- 目标工具：【填入工具名称，影响参数格式】

提示词要求：
- 必须描述从画面开始到结束的完整运动过程（不能只描述静止状态）
- 镜头运动方向使用具体描述：camera slowly pushes in / pans right / tilts up / tracks subject
- 每段时长控制在2-5秒（Seedance/即梦的最佳生成区间，超出质量下降）
- 不描述超出AI视频能力的动作（多人复杂互动、快速变形等）
- 使用英文输出，风格标签与图像提示词保持一致

Seedance特有要求（如目标工具是Seedance）：
- 场景描述放在前，运动描述放在后
- 明确标注"15 seconds short film style"增强电影质感
- 避免超过3个连续动作的复杂描述（Seedance对长提示词敏感度下降）

输出：所有分镜的视频提示词列表（编号 + 完整英文提示词 + 秒数标注）

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下视频提示词是否存在以下问题：
1. 是否有提示词只描述静止画面，没有运动描述（静止视频不是视频）？
2. 每段时长是否控制在2-5秒（过长会导致质量下降）？
3. 镜头运动描述是否与节点4的镜头设计一致？
4. 是否有动作描述过于复杂，超出AI视频工具的实际能力？

【粘贴视频提示词列表】

逐条说明问题。

D. 返修优化版¶

根据自查意见修改视频提示词。为静止描述加入运动过程，拆分超时段落，简化复杂动作，对齐镜头运动设计。

原始提示词：【粘贴原始提示词】
自查意见：【粘贴自查结果】

7.5 交付给下游节点¶

将所有分镜的视频提示词列表复制，同时交给： - 节点 8（配音字幕专家）：了解视频节奏，配合设计配音时间点。 - 节点 9（成片审查专家）：作为审查分镜完整性的输入材料。

7.6 人工验收清单¶

[ ] 每段视频提示词是否都包含了运动描述（不是纯静止描述）？
[ ] 每段时长是否在 2-5 秒之间？
[ ] 镜头运动描述是否与节点 4 的设计一致？

节点 8：配音字幕专家¶

8.1 节点定位¶

为 15 秒短片生成与画面节奏匹配的配音文案和字幕方案。配音不是原文的朗读，而是对画面的情绪强化——有时候沉默比台词更有力量。这个节点的关键在于"取舍"，哪些内容需要说出来，哪些内容让画面说话。

8.2 输入与输出¶

输入：节点 1 原文解析（旁白素材标注）+ 节点 2 情绪节奏时间表

输出：15 秒配音文案（含旁白和对话，带时间标注）+ 字幕方案（按时间段分行）

8.3 使用顺序¶

先用「快速生成版」得到配音文案初稿。
情感层次复杂或需要中英文字幕时，改用「专家增强版」。
用「自查审稿版」检查配音是否与画面节奏匹配。
有问题则用「返修优化版」修正。
对照 8.6 验收清单确认，通过后交给节点 9。

8.4 提示词包¶

A. 快速生成版¶

请根据以下信息，为15秒短片生成配音文案和字幕方案。

原文中的旁白素材：【粘贴节点1标注的"旁白素材"部分】
情绪节奏时间表：【粘贴节点2的时间表】

要求：
- 配音总字数控制在50字以内（15秒内的朗读量）
- 情绪高潮段（11-13秒）可以选择沉默（画面本身说话）
- 字幕每行不超过12字，按时间段分行

B. 专家增强版¶

你是一位短片配音文案师，专注于将文学语言转化为与画面节奏匹配的音频体验。

任务：为以下15秒短片设计配音文案，取舍有据，让声音和画面共同构成情绪体验。

输入：
- 原文旁白素材（来自节点1）：【粘贴标注为"旁白素材"的内容】
- 情绪节奏时间表（来自节点2）：【粘贴时间表】
- 视频整体情绪主线：【填入主情绪标签】

设计原则：
- 0-3秒建立段：可以有短旁白引入（不超过10字），也可以沉默配合画面
- 4-10秒发展段：选择性使用旁白，优先选择有画面感的句子
- 11-13秒高潮段：建议沉默或单字/短句（高潮处大量旁白会削弱画面冲击力）
- 14-15秒余韵段：可以有一句收尾旁白（不超过8字）

配音文案要求：
- 每句台词不超过12字（朗读速度约3字/秒）
- 带情绪标注（[平静] [压抑] [哽咽] 等）
- 标注停顿位置（用"/"表示节奏停顿，"……"表示情绪停顿）

字幕方案：按时间段分行，每行不超过12字，标注出现时间区间。

输出：配音文案（带时间标注和情绪标注）+ 字幕方案

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下配音文案和字幕方案是否存在以下问题：
1. 配音总字数是否在50字以内（15秒朗读量限制）？
2. 情绪高潮段（11-13秒）是否使用了沉默或短句，而非大段旁白？
3. 是否有读起来绕口或节奏不自然的句子？
4. 字幕每行是否都在12字以内？

【粘贴配音文案和字幕方案】

逐条说明问题。

D. 返修优化版¶

根据自查意见修改配音文案。压缩总字数，简化高潮段旁白（改为短句或沉默），修正绕口句子，调整字幕分行。

原始文案：【粘贴原始配音文案】
自查意见：【粘贴自查结果】

8.5 交付给下游节点¶

将配音文案（带时间标注）和字幕方案完整复制，交给节点 9（成片审查专家）。节点 9 将综合检查画面、声音和节奏的整体匹配。

8.6 人工验收清单¶

[ ] 配音总字数是否在 50 字以内？
[ ] 情绪高潮段是否使用了沉默或短句（而非大段旁白）？
[ ] 字幕每行是否在 12 字以内？

节点 9：成片审查专家¶

9.1 节点定位¶

这是一个跨内容的全局审查节点，对完整的 15 秒分镜脚本进行系统性验收，检查视觉连贯性、角色一致性、时长精确性和声画匹配。任何单个节点的自查都无法覆盖跨节点的整体问题，这个节点是最终发稿前的质量关卡。

9.2 输入与输出¶

输入：所有前序节点的完整输出（场景拆分 + 镜头设计 + 角色词库 + 图像提示词 + 视频提示词 + 配音文案）

输出：成片审查报告（问题清单 + 通过/需修改结论）

9.3 使用顺序¶

先用「快速生成版」做快速整体审查。
需要深度检查跨镜头一致性时，改用「专家增强版」。
用「自查审稿版」复查审查报告的完整性（可选）。
审查结论为"通过"后，整合为完整分镜脚本；结论为"需修改"时，返回对应节点修改后重新审查。
对照 9.6 验收清单确认。

9.4 提示词包¶

A. 快速生成版¶

请对以下15秒分镜脚本进行整体审查，检查关键问题。

场景拆分（含总时长）：【粘贴节点3的场景表格】
镜头设计：【粘贴节点4的设计摘要】
图像提示词列表：【粘贴节点6的提示词（只看角色固定词部分）】
视频提示词列表（只看时长数字）：【粘贴节点7的时长标注】
配音文案（含时间标注）：【粘贴节点8的文案】

检查项：
1. 所有场景时长加总是否精确等于15秒？
2. 所有图像提示词中角色固定词是否完全一致？
3. 配音时间点是否与情绪节奏时间表对齐？
4. 是否有视频提示词段落时长超过5秒？

输出：问题清单 + 通过/需修改结论

B. 专家增强版¶

你是一位AI短视频成品质量审查专家，负责在发布前对分镜脚本进行全面验收。

任务：对以下完整15秒分镜脚本进行系统性审查，从视觉连贯性、角色一致性、节奏匹配三个维度评分。

输入：
- 完整分镜脚本（所有节点输出）：【粘贴所有内容】

审查维度：

1. 时长精确性（满分20分）
   - 所有段落时长加总是否精确等于15秒
   - 视频提示词段落是否都在2-5秒区间

2. 角色一致性（满分30分）
   - 所有图像提示词的角色固定词是否完全一致
   - 角色固定词是否包含了足够的区分特征

3. 情绪节奏匹配（满分25分）
   - 高潮段的镜头设计是否匹配情绪强度（特写/推镜）
   - 配音时间点是否与情绪节奏对齐

4. 技术可行性（满分25分）
   - 视频提示词中是否有超出AI工具能力的动作描述
   - 图像提示词格式是否符合目标工具要求

合格线：总分80分。低于80分需要修改对应维度后重新审查。

输出：各维度评分表 + 低分维度的具体问题 + 总体结论（通过/需修改）

C. 自查审稿版¶

此为当前节点的自查模式，不是新的专家角色。

请检查以下成片审查报告是否存在以下问题：
1. 审查是否只检查了时长和角色词，遗漏了情绪节奏匹配问题？
2. 修改建议是否明确指向了哪个节点的哪个部分需要修改？

【粘贴成片审查报告】

D. 返修优化版¶

根据成片审查报告中指出的问题，修改对应的分镜内容。每次只修改审查报告指出的最高优先级问题，修改完成后重新送审。

审查报告：【粘贴审查结果】
需要修改的节点：【填入需要返回哪个节点修改】

9.5 交付给下游节点¶

审查通过后，将所有分镜内容整合为完整分镜脚本包（参见最终输出模板），可直接进入 AI 视频生成阶段。

9.6 人工验收清单¶

[ ] 所有场景段落时长加总是否精确等于 15 秒？
[ ] 所有图像提示词中的角色固定词是否完全一致（可逐字对比）？
[ ] 视频提示词每段时长是否都在 2-5 秒之间？
[ ] 成片审查结论是否为"通过"（结论为"需修改"时必须返回对应节点修改后重新审查）？

节点交接说明¶

上游节点	交接内容	下游节点
节点 1 原文解析	将情绪标签、场景要素、动作清单完整复制	节点 2
节点 2 情绪节奏	将情绪节奏时间表（精确到秒）复制	节点 3
节点 3 场景拆分	将场景拆分表格复制，同时传给节点 4 和节点 5	节点 4、节点 5
节点 4 镜头设计	将镜头设计方案复制，同时传给节点 5、6、7	节点 5、节点 6、节点 7
节点 5 角色连续性	将角色固定词和快速调用卡复制，传给节点 6 和节点 7	节点 6、节点 7
节点 6 画面提示词	将图像提示词列表复制，传给节点 7 参考	节点 7
节点 7 视频提示词	将视频提示词列表复制，传给节点 8 和节点 9	节点 8、节点 9
节点 8 配音字幕	将配音文案和字幕方案复制，传给节点 9	节点 9
节点 9 成片审查	审查通过后整合所有内容，纳入最终输出模板	最终输出模板

最终输出模板¶

【原文标题或自定义标题】15秒分镜脚本包

━━ 基础信息 ━━
总时长：15秒
视觉风格：【填入】
目标工具：【填入】

━━ 情绪节奏时间轴 ━━
0:00-0:03  [情绪状态]
0:04-0:10  [情绪状态]
0:11-0:13  [高潮情绪]
0:14-0:15  [余韵情绪]

━━ 角色一致性词库 ━━
主角固定词：[英文固定词组]
快速调用卡：[30字以内核心描述]

━━ 分镜脚本 ━━

场景1：[时间区间] [情绪强度]
环境：[场景描述]
镜头：[景别] + [镜头运动]
图像提示词：
[完整英文图像提示词]
视频提示词：
[完整英文视频提示词，含时长]

场景2：[时间区间] [情绪强度]
（以此类推至全部场景）

━━ 配音文案 ━━
[带时间标注和情绪标注的配音稿]

━━ 字幕方案 ━━
[按时间段分行的字幕内容]

常见错误¶

错误 1：跳过情绪节奏设计直接拆场景

表现：场景拆分完成后，画面呈现的是"15秒内的平铺直叙"，没有情绪起伏，视频看起来像幻灯片而不是短片。

修复：必须先完成节点 2，在确定情绪弧线和高潮时间点后，再根据时长分配来拆分场景，确保情绪高潮出现在第 11-13 秒。

错误 2：不同分镜的角色固定词不一致

表现：同一个角色在第 1 段是棕色眼睛，第 3 段变成蓝色眼睛，第 5 段发型也改变了，AI 生成时每段都是"不同的人"。

修复：必须执行节点 5，在开始生成任何提示词之前建立角色词库，并在节点 6 和节点 7 的每一条提示词中完整复制角色固定词，不能改写或省略。

错误 3：视频提示词描述静止画面

表现：生成的每段视频都只有轻微的画面抖动，没有真正的镜头运动，连接后就是"高清幻灯片"。

修复：执行节点 7 的自查审稿版，确认每段提示词都包含了明确的镜头运动描述（camera pushes in / pans / tracks），而不只是场景描述。

人工验收清单¶

[ ] 所有场景时长加总是否精确等于 15 秒？
[ ] 情绪高潮是否出现在第 11-13 秒区间？
[ ] 所有分镜提示词中的角色固定词是否完全一致（可逐字比对）？
[ ] 视频提示词是否每段都包含了镜头运动描述？
[ ] 成片审查是否通过？

延伸玩法¶

变体 1：30 秒版本：在情绪节奏节点（节点 2）将时间轴扩展为 30 秒，场景数量从 4-6 个增加到 8-10 个，其余节点不变。
变体 2：纯视觉版（无配音）：跳过节点 8，在节点 2 的情绪设计中专门为无配音版本增强画面情绪密度，让视觉独立承载所有情绪信息。
进阶组合：与"工作流 05（角色设定工作流）"结合，直接使用角色设定工作流输出的提示词组作为节点 5 角色词库的输入，实现从故事文本到角色设计到视频生成的全链路一体化；与"工作流 04（短剧策划工作流）"结合，将短剧高潮集的场景描述作为本工作流的原始文案，快速生成宣传预告片。