跳转至

工作流 06:从小说文案到 15 秒电影级分镜脚本的 AI 多专家工作流

适用岗位:AI 视频创作者、Seedance/即梦用户、短片导演、小说改编视频创作者

真实场景:你有一段小说文字或故事文案(100-300 字),想用 AI 视频工具(Seedance、即梦、Kling)生成一段 15 秒的电影级短片,但不知道如何把文字转化成每个镜头都有明确提示词的分镜脚本。

最终目标:完整的 15 秒分镜脚本,包含:场景拆分方案、每个分镜的镜头设计、角色连续性描述词库、每个分镜的图像提示词和视频提示词(英文)、配音文案和字幕方案。


输入材料清单

开始前请准备以下材料:

  • 原始小说文案或故事文字(100-300 字,一段完整的情节片段)
  • 主角外貌描述(可选,已有角色设定则直接使用)
  • 目标视觉风格(写实电影感 / 古风水墨 / 科幻赛博 / 动漫风格)
  • 目标工具(Seedance / 即梦 / Kling / Sora,影响提示词格式)
  • 是否需要配音(是/否,影响配音文案节点是否执行)

工作流总览

节点 1:原文解析专家
  ↓ 输出:核心情绪 + 场景要素 + 人物动作清单
节点 2:情绪节奏专家
  ↓ 输出:15秒情绪弧线 + 高潮时间点设计
节点 3:场景拆分专家
  ↓ 输出:4-6个场景段落(每段约2-4秒)
节点 4:镜头设计专家
  ↓ 输出:每个场景的景别/运动/切换方式
节点 5:角色连续性专家
  ↓ 输出:角色一致性描述词库
节点 6:画面提示词专家
  ↓ 输出:每个分镜的图像生成提示词(英文)
节点 7:视频提示词专家
  ↓ 输出:每个分镜的视频生成提示词(英文)
节点 8:配音字幕专家
  ↓ 输出:15秒配音文案 + 字幕方案
节点 9:成片审查专家(跨内容全局审查)
  ↓ 输出:成片审查报告 + 修改建议
最终交付:完整15秒分镜脚本包

专家节点详解

每个节点包含六部分:节点定位、输入与输出、使用顺序、提示词包(A 快速 / B 专家 / C 自查 / D 返修)、交付给下游节点、人工验收清单。

关于节点 9(成片审查专家):这是一个跨内容的全局审查节点,负责检查所有分镜的连贯性、角色一致性和总时长匹配,性质与其他节点的自查审稿版不同——它是对整套分镜脚本进行系统性验收的独立节点。

其他节点的 C 自查审稿版和 D 返修优化版是当前节点内部的工作模式,不是新的专家角色。


节点 1:原文解析专家

1.1 节点定位

从原始小说文案中提取可视化的核心元素:主要情绪、关键场景、人物动作和环境细节。原文是文字思维,视频是画面思维,这个节点完成从文字到画面的第一次转化。

1.2 输入与输出

输入:原始小说文案(100-300 字)

输出:情绪标签(主情绪 + 情绪变化点)+ 场景要素清单(地点/时间/天气/光线)+ 人物动作清单(关键行为)+ 可视化细节清单

1.3 使用顺序

  1. 先用「快速生成版」得到解析结果初稿。
  2. 原文含有隐喻或意象较多时,改用「专家增强版」。
  3. 用「自查审稿版」检查提取的元素是否都能被画面呈现。
  4. 有问题则用「返修优化版」修正。
  5. 对照 1.6 验收清单确认,通过后交给节点 2。

1.4 提示词包

A. 快速生成版
你是一位视频分镜师。请从以下小说文案中提取可视化元素。

原始文案:【粘贴小说文案】

输出:
1. 主情绪标签(一个词,例如:悲伤/热烈/压抑/爽快)
2. 情绪变化点(文案中情绪发生转变的位置,一句话说明)
3. 关键场景要素(地点、时间、天气、光线条件)
4. 人物核心动作(3-5个关键行为,每条一句话)
5. 可视化细节(可以成为画面亮点的具体细节描写)
B. 专家增强版
你是一位资深影视分镜导演,擅长将文学语言转化为画面语言。

任务:对以下小说文案进行深度视觉化解析,提取所有能被镜头捕捉的元素,剔除无法画面化的纯心理描述。

输入:
- 原始文案:【粘贴小说文案】

解析维度:
1. 情绪弧线(文案开始/中间/结尾各处的情绪标签,构成情绪走向)
2. 空间层次(近景元素/中景元素/远景元素,立体还原场景)
3. 时间线索(白天/夜晚/光线角度,精确到时间段)
4. 动作序列(人物动作按先后顺序排列,每个动作的力度和速度)
5. 视觉焦点(哪些细节在画面中应该被强调,哪些是背景)
6. 无法画面化的内容(心理活动、叙述者视角等,标注为"旁白素材")

约束:所有提取结果必须是可以被摄影机捕捉的画面元素,心理描述必须转化为外化行为或单独标注为旁白。

输出:6个维度的结构化解析报告
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下原文解析是否存在以下问题:
1. 是否有纯心理描写被当作画面元素提取(无法被摄影机捕捉的内容)?
2. 场景要素是否足够具体(不能只写"室外",需要说明具体环境)?
3. 人物动作是否是可执行的具体行为(不能只写"他很痛苦")?
4. 情绪变化点是否有对应的可视化行为或环境变化支撑?

【粘贴原文解析内容】

逐条说明问题。
D. 返修优化版
根据自查意见修改原文解析。将心理描写转化为外化行为或标注为旁白,具体化模糊的场景要素,补充情绪变化点的视觉支撑。

原始解析:【粘贴原始解析结果】
自查意见:【粘贴自查结果】

1.5 交付给下游节点

将解析结果(情绪标签 + 场景要素 + 动作清单 + 可视化细节)完整复制,交给节点 2(情绪节奏专家)。节点 2 将基于情绪弧线设计 15 秒内的节奏方案。

1.6 人工验收清单

  • [ ] 所有提取的元素是否都可以被摄影机捕捉(无纯心理描写)?
  • [ ] 是否标注了情绪变化的具体位置?
  • [ ] 场景要素是否包含了地点、时间、光线三个维度?

节点 2:情绪节奏专家

2.1 节点定位

将原文的情绪弧线压缩到 15 秒内,设计情绪起伏的节拍时间点和高潮位置。15 秒内节奏设计的核心挑战是:既要让观众感受到情绪变化,又不能因为节奏太密导致视觉疲劳。这个节点是本工作流区别于普通分镜工作流的核心差异点。

2.2 输入与输出

输入:节点 1 的情绪标签和情绪变化点

输出:15 秒情绪弧线时间表(每个时间节点的情绪状态)+ 高潮时间点 + 每段时长建议

2.3 使用顺序

  1. 先用「快速生成版」得到情绪节奏初稿。
  2. 需要精细控制节奏的情绪场景时,改用「专家增强版」。
  3. 用「自查审稿版」检查情绪节拍是否合理、高潮位置是否有效。
  4. 有问题则用「返修优化版」调整。
  5. 对照 2.6 验收清单确认,通过后交给节点 3。

2.4 提示词包

A. 快速生成版
你是一位视频节奏设计师。请根据以下情绪分析,设计15秒视频的情绪节奏方案。

情绪标签:【粘贴节点1的情绪弧线分析】

输出:
1. 15秒情绪节奏表(每3-4秒一个情绪节点,标注情绪状态)
2. 高潮时间点(情绪最强烈的时刻在第几秒)
3. 开头和结尾的情绪定调
4. 每个情绪段落的建议时长(秒)
B. 专家增强版
你是一位专注于短视频情绪设计的剪辑师和导演,深度研究过15秒内制造情绪共鸣的节奏规律。

任务:将以下情绪弧线压缩为15秒内的精确节奏设计,确保情绪起伏清晰可感,同时节奏不过分密集。

输入:
- 情绪弧线分析:【粘贴节点1的完整情绪分析】
- 目标视觉风格:【填入风格,影响节奏基调】

设计原则:
- 0-3秒:情绪建立段(建立基础情绪状态,不能平淡但也不能立即进入最高强度)
- 4-10秒:情绪发展段(情绪主体内容,有1-2次明显的强度变化)
- 11-13秒:情绪高潮段(最强烈的情绪时刻,视觉和音乐配合达到顶点)
- 14-15秒:情绪余韵(一个让情绪慢慢落下或留有余味的收尾画面)

约束:高潮段必须在第11-13秒,不能在最后一秒(没有余韵)也不能在第5秒(后续太平淡)。

输出:精确到秒的情绪节奏表(时间轴格式)+ 每段建议镜头数量 + 高潮段情绪强化建议
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下情绪节奏设计是否存在以下问题:
1. 高潮时间点是否在第11-13秒区间,而不是在最后一秒或前五秒?
2. 是否有连续5秒以上情绪强度几乎没有变化的平淡段落?
3. 开头3秒是否有足够的情绪建立,而不是完全平铺直叙?
4. 结尾是否有情绪余韵设计,而不是戛然而止?

【粘贴情绪节奏设计内容】

逐条说明问题。
D. 返修优化版
根据自查意见调整情绪节奏设计。修正高潮位置,填补平淡段落,强化开头情绪建立,补充结尾余韵设计。

原始设计:【粘贴原始节奏设计】
自查意见:【粘贴自查结果】

2.5 交付给下游节点

将情绪节奏时间表(含每段时长建议)完整复制,交给节点 3(场景拆分专家)。节点 3 将根据时长建议将文案拆分为对应时长的场景段落。

2.6 人工验收清单

  • [ ] 情绪高潮是否在第 11-13 秒区间内?
  • [ ] 是否有明确的结尾余韵设计(不是戛然而止)?
  • [ ] 每个情绪段落的时长是否合理(没有 5 秒以上的平淡段)?

节点 3:场景拆分专家

3.1 节点定位

将原始文案按照情绪节奏时间表拆分为 4-6 个可拍摄的场景段落,每个场景段落对应一段固定时长。场景拆分决定了每个镜头的内容边界,是后续镜头设计和提示词生成的直接输入。

3.2 输入与输出

输入:节点 1 原文解析(场景要素 + 动作清单)+ 节点 2 情绪节奏时间表

输出:4-6 个场景段落(每段:时间区间 + 场景描述 + 核心动作 + 情绪标注)

3.3 使用顺序

  1. 先用「快速生成版」得到场景拆分初稿。
  2. 场景切换较多或原文节奏复杂时,改用「专家增强版」。
  3. 用「自查审稿版」检查场景时长和内容量是否匹配。
  4. 有问题则用「返修优化版」调整。
  5. 对照 3.6 验收清单确认,通过后交给节点 4。

3.4 提示词包

A. 快速生成版
你是一位视频分镜师。请将以下文案按照情绪节奏时间表拆分为场景段落。

原文解析:【粘贴节点1的场景要素和动作清单】
情绪节奏时间表:【粘贴节点2的时间表】

输出(每个场景段落):
场景X:[时间区间] | [地点和环境] | [核心动作描述] | [情绪标注]
(共4-6个场景)
B. 专家增强版
你是一位影视分镜导演,擅长将短小文案转化为节奏精准的场景拆分方案。

任务:按照以下情绪节奏时间表,将文案内容拆分为场景段落,确保每段的内容量与时长匹配。

输入:
- 原文解析结果:【粘贴节点1的完整解析】
- 情绪节奏时间表:【粘贴节点2的时间表(精确到秒)】

拆分原则:
1. 每个场景段落的时长与情绪节奏时间表对应
2. 场景切换时机与情绪变化点对齐(情绪转折处切场景)
3. 情绪高潮段保持单一场景,不要在高潮处切换场景
4. 每段的内容量评估(2秒的场景不能有超过1个核心动作)

每个场景段落必须包含:
- 精确时间区间(例如:0:00-0:03)
- 场景环境(空间描述+光线条件)
- 核心动作(该段内发生的主要视觉事件)
- 情绪强度(1-5分,对应情绪节奏时间表)
- 镜头数量建议(该段建议用几个镜头完成)

约束:4-6个场景总时长必须精确等于15秒。

输出:场景拆分表格(含5个维度)+ 场景切换逻辑说明
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下场景拆分是否存在以下问题:
1. 所有场景段落时长加总是否精确等于15秒?
2. 是否有单个场景时长只有1秒但包含超过1个核心动作(来不及呈现)?
3. 情绪高潮段是否保持了单一场景,没有在高潮处切换场景?
4. 场景切换点是否与情绪变化点对齐?

【粘贴场景拆分内容】

逐条说明问题。
D. 返修优化版
根据自查意见调整场景拆分。修正总时长,压缩过度的场景内容量,对齐情绪变化点和场景切换点。

原始拆分:【粘贴原始场景拆分】
自查意见:【粘贴自查结果】

3.5 交付给下游节点

将场景拆分表格(含时间区间、环境描述、核心动作、情绪强度)完整复制,同时交给: - 节点 4(镜头设计专家):用于设计每个场景的具体镜头语言。 - 节点 5(角色连续性专家):了解角色在不同场景中的外貌需求。

3.6 人工验收清单

  • [ ] 所有场景段落时长加总是否精确等于 15 秒?
  • [ ] 情绪高潮段是否保持单一场景,没有在高潮处切换?
  • [ ] 每个场景的内容量是否与时长匹配(不超载也不空洞)?

节点 4:镜头设计专家

4.1 节点定位

为每个场景段落设计具体的镜头语言:景别选择、镜头运动方式和场景切换方式。镜头设计是从"拍什么"到"怎么拍"的转化,直接决定画面提示词和视频提示词的核心参数。

4.2 输入与输出

输入:节点 3 的场景拆分表格

输出:每个场景的镜头设计方案(景别 + 镜头运动 + 切换方式 + 构图重点)

4.3 使用顺序

  1. 先用「快速生成版」得到镜头设计初稿。
  2. 需要精确控制情绪强化效果时,改用「专家增强版」。
  3. 用「自查审稿版」检查景别变化和情绪匹配。
  4. 有问题则用「返修优化版」调整。
  5. 对照 4.6 验收清单确认,通过后同时交给节点 5、6、7。

4.4 提示词包

A. 快速生成版
你是一位分镜导演。请根据以下场景拆分,设计每个场景的镜头方案。

场景拆分:【粘贴节点3的场景表格】

每个场景输出:
景别(远景/全景/中景/近景/特写)
镜头运动(固定/推/拉/横移/跟拍)
切换方式(与上一场景:硬切/淡入/转场)
构图重点(画面焦点在哪里)
B. 专家增强版
你是一位电影级短片导演,专注于用有限镜头数量制造最大情绪冲击。

任务:为以下场景拆分设计精确的镜头语言,确保镜头设计强化情绪节奏,而不是随机选择。

输入:
- 场景拆分表格:【粘贴节点3的完整拆分】
- 情绪节奏时间表:【粘贴节点2的时间表,了解每段情绪强度】

设计原则:
- 情绪建立段(0-3秒):全景或中景建立空间感,固定或缓慢推进的镜头
- 情绪发展段(4-10秒):随情绪升高逐渐靠近,切换频率可以加快
- 情绪高潮段(11-13秒):特写或极近景,推镜头或跟拍强化情绪
- 情绪余韵段(14-15秒):拉镜或固定远景,留出画面呼吸感

约束:相邻镜头景别变化不能超过2级(全景不能直接切特写);情绪高潮段不能用固定长镜头。

输出:每个场景的镜头设计卡(景别/运动/切换/构图/情绪匹配说明)
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下镜头设计是否存在以下问题:
1. 情绪高潮段是否使用了推镜或特写,而不是固定远景?
2. 相邻镜头景别变化是否超过2级(例如全景直接切特写)?
3. 是否有连续3个以上相同景别,缺少视觉变化?
4. 余韵段是否有足够的画面呼吸感(不能是快速切换的多镜头)?

【粘贴镜头设计内容】

逐条说明问题。
D. 返修优化版
根据自查意见调整镜头设计。修正高潮段镜头不足,补充景别变化,拉开相邻镜头景别差距,为余韵段增加呼吸空间。

原始设计:【粘贴原始镜头设计】
自查意见:【粘贴自查结果】

4.5 交付给下游节点

将镜头设计方案完整复制,同时交给: - 节点 5(角色连续性专家):了解每个场景中角色的构图位置。 - 节点 6(画面提示词专家):作为图像提示词中的镜头参数来源。 - 节点 7(视频提示词专家):作为视频运动描述的直接依据。

4.6 人工验收清单

  • [ ] 情绪高潮段是否使用了推镜或特写,而非固定远景?
  • [ ] 相邻镜头景别变化是否不超过 2 级?
  • [ ] 是否没有连续 3 个以上相同景别?

节点 5:角色连续性专家

5.1 节点定位

在分镜开始生成提示词之前,建立角色的一致性描述词库,确保角色在所有分镜中外貌保持一致。这是本工作流中的关键质量控制节点——如果跳过这一步,AI 生成的视频中同一个人物在不同镜头里会"换脸"。

5.2 输入与输出

输入:主角外貌描述(来自输入材料或来自工作流 05 的角色设定文档)+ 节点 3 场景拆分(了解场景中的着装需求)

输出:角色一致性描述词库(固定外貌词组 + 场景可变词 + 快速调用卡)

5.3 使用顺序

  1. 先用「快速生成版」得到词库初稿。
  2. 有多个角色或角色在场景中有服装变化时,改用「专家增强版」。
  3. 用「自查审稿版」检查词库是否足够精确、可变词是否清晰。
  4. 有问题则用「返修优化版」修正。
  5. 对照 5.6 验收清单确认,通过后同时交给节点 6 和节点 7。

5.4 提示词包

A. 快速生成版
你是一位AI绘图提示词工程师。请根据以下角色描述,建立角色一致性描述词库。

角色外貌描述:【填入主角外貌描述,或粘贴工作流05的角色设定输出】
场景列表:【粘贴节点3的场景环境描述摘要】

输出:
1. 固定外貌词组(每次生成该角色时必须包含的英文词汇)
2. 场景可变词(根据场景可以替换的服装/背景词汇)
3. 快速调用卡(30字以内的核心描述词,适合添加到任何提示词前)
B. 专家增强版
你是一位专注于AI视频角色连续性的提示词工程师。

任务:为以下角色建立精确的一致性描述词库,确保在所有分镜的图像和视频提示词中,同一角色的外貌始终一致。

输入:
- 角色外貌描述:【填入主角描述或粘贴工作流05输出】
- 场景拆分(了解各场景的外貌需求):【粘贴节点3的场景描述】

词库结构:
1. 固定词(所有场景必须包含):面部特征词 + 发型发色词 + 体型词 + 肤色词
   格式:英文词汇,用逗号分隔,总长度不超过50个词
2. 半固定词(通常包含,可根据剧情调整):标志性服装元素 + 特定道具
3. 可变词(根据场景替换):具体场景服装 + 背景 + 光线
4. 负面词(防止AI生成错误外貌):该角色不能出现的外貌特征

特别要求:
- 如有多个角色,为每个角色提供独立词库,并标注区分关键词
- 固定词必须是Midjourney/SD可以理解的标准词汇,不能用中文或自造词

输出:角色词库表格(4个维度)+ 快速调用卡
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下角色一致性词库是否存在以下问题:
1. 固定词是否足够简洁精确(过长会压缩其他描述词的权重)?
2. 固定词是否包含了最能区分该角色的外貌特征(发色、眼睛等)?
3. 可变词和固定词之间是否存在矛盾(例如固定词有long hair,可变词又改了发型)?
4. 是否包含了负面词,防止常见的AI外貌生成错误?

【粘贴角色一致性词库】

逐条说明问题。
D. 返修优化版
根据自查意见精炼词库。压缩过长的固定词,突出区分性特征,消除固定词和可变词的矛盾,补充负面词。

原始词库:【粘贴原始词库】
自查意见:【粘贴自查结果】

5.5 交付给下游节点

将角色一致性词库(固定词 + 快速调用卡)完整复制,同时交给: - 节点 6(画面提示词专家):在每个图像提示词中加入固定词。 - 节点 7(视频提示词专家):在每个视频提示词中加入固定词。

5.6 人工验收清单

  • [ ] 固定词是否包含了最能区分角色的外貌特征(发色、眼睛颜色等)?
  • [ ] 固定词和可变词之间是否没有矛盾?
  • [ ] 是否包含了防止常见生成错误的负面词?

节点 6:画面提示词专家

6.1 节点定位

为每个分镜生成可直接用于 Midjourney/Stable Diffusion/即梦的图像提示词。图像是视频生成的参考基础,图像提示词的质量直接影响最终视频的画面质量。

6.2 输入与输出

输入:节点 3 场景拆分 + 节点 4 镜头设计 + 节点 5 角色一致性词库

输出:每个分镜的完整英文图像提示词(含角色固定词 + 场景描述 + 镜头参数 + 风格标签)

6.3 使用顺序

  1. 先用「快速生成版」得到图像提示词初稿。
  2. 需要精确的风格一致性或特殊光线处理时,改用「专家增强版」。
  3. 用「自查审稿版」检查角色固定词是否一致、参数是否完整。
  4. 有问题则用「返修优化版」修正。
  5. 对照 6.6 验收清单确认,通过后交给节点 7。

6.4 提示词包

A. 快速生成版
你是一位AI图像提示词工程师。请为以下分镜生成图像提示词。

场景拆分:【粘贴节点3的场景表格(选择一个场景)】
镜头设计:【粘贴节点4该场景的镜头设计】
角色固定词:【粘贴节点5的快速调用卡】
目标工具:【填入Midjourney v6 / Stable Diffusion】
视觉风格:【填入风格】

提示词格式:
[角色固定词], [动作描述], [场景/背景], [光线], [镜头参数], [风格标签], [质量标签], [画幅参数]
B. 专家增强版
你是一位AI图像提示词工程师,专注于电影级分镜图像生成。

任务:为以下所有分镜生成完整的图像提示词,确保风格统一、角色一致、光线匹配情绪。

输入:
- 所有场景拆分:【粘贴节点3的完整表格】
- 镜头设计:【粘贴节点4的完整设计】
- 角色一致性词库:【粘贴节点5的固定词 + 快速调用卡】
- 视觉风格:【填入风格,例如:cinematic film noir / warm golden hour / cold blue atmosphere】

提示词结构(每个分镜):
[角色固定词(每张图必须完全相同)], [当前姿势/动作], [场景环境描述], [光线处理(匹配情绪强度)], [景别和构图(来自节点4)], [视觉风格标签], [质量标签:masterpiece, best quality, ultra detailed], [参数:--ar 9:16 --v 6(Midjourney)]

情绪高潮分镜的光线处理:
- 强烈情绪(悲伤/愤怒/爱):强对比光/逆光/暖色调聚光
- 平静情绪:散射柔光/自然环境光
- 神秘/紧张:冷色调/阴影覆盖面部/局部照明

约束:每个分镜的角色固定词必须完全一致(复制粘贴,不能改写)。

输出:所有分镜的图像提示词列表(编号 + 完整英文提示词)
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下图像提示词是否存在以下问题:
1. 所有分镜中角色固定词是否完全相同(一字不差)?
2. 情绪高潮分镜的光线处理是否与情绪强度匹配(高强度情绪不能用平淡柔光)?
3. 是否每个提示词都包含了景别/构图描述(来自镜头设计)?
4. 是否所有提示词都包含了画幅参数(--ar 9:16 或对应参数)?

【粘贴图像提示词列表】

逐条说明问题。
D. 返修优化版
根据自查意见修正图像提示词。统一角色固定词,调整情绪高潮的光线处理,补充缺失的镜头参数和画幅参数。

原始提示词:【粘贴原始提示词列表】
自查意见:【粘贴自查结果】
角色固定词(统一版):【粘贴节点5的固定词】

6.5 交付给下游节点

将所有分镜的图像提示词列表(编号 + 完整英文提示词)复制,交给节点 7(视频提示词专家)参考。节点 7 将基于图像提示词的场景描述,加入运动描述生成视频提示词。

6.6 人工验收清单

  • [ ] 所有分镜的角色固定词是否完全一致(可以逐字对比验证)?
  • [ ] 情绪高潮分镜的光线处理是否比其他段落更强烈?
  • [ ] 是否每个提示词都包含了景别参数和画幅参数?

节点 7:视频提示词专家

7.1 节点定位

将分镜的静态描述转化为适合 Seedance/即梦/Kling 等 AI 视频工具的动态提示词,重点描述每个分镜从开始到结束的画面运动过程。视频提示词与图像提示词的核心区别是:视频提示词必须描述运动,而不是静止构图。

7.2 输入与输出

输入:节点 4 镜头设计 + 节点 5 角色固定词 + 节点 6 图像提示词(参考场景描述)

输出:每个分镜的视频生成提示词(英文,含场景、运动过程、镜头方向、时长、风格)

7.3 使用顺序

  1. 先用「快速生成版」得到视频提示词初稿。
  2. 需要更精确的运动描述或针对特定工具优化时,改用「专家增强版」。
  3. 用「自查审稿版」检查运动描述完整性和时长合理性。
  4. 有问题则用「返修优化版」修正。
  5. 对照 7.6 验收清单确认,通过后交给节点 8 和节点 9。

7.4 提示词包

A. 快速生成版
你是一位AI视频提示词工程师。请为以下分镜生成视频提示词(适用于Seedance/即梦/Kling)。

分镜信息(一个场景):
- 场景描述:【粘贴节点3的场景环境】
- 镜头运动:【粘贴节点4的运动设计】
- 角色固定词:【粘贴节点5的快速调用卡】
- 时长:【填入该段秒数】

提示词格式:
[场景描述], [人物动作], [镜头运动方向], [时长] seconds, [风格], [光线]
示例:A young woman stands in the rain, slowly raises her head to look at the sky, camera gently pushes in from medium shot to close-up, 3 seconds, cinematic, soft blue cold light
B. 专家增强版
你是一位AI视频导演,专注于用Seedance/即梦/Kling生成电影级短视频。

任务:为以下所有分镜生成完整的视频生成提示词,重点描述每段画面的运动过程,确保连接后形成连贯的15秒短片。

输入:
- 场景拆分(含时长):【粘贴节点3的完整表格】
- 镜头设计(含运动方式):【粘贴节点4的完整设计】
- 角色固定词:【粘贴节点5的固定词】
- 目标工具:【填入工具名称,影响参数格式】

提示词要求:
- 必须描述从画面开始到结束的完整运动过程(不能只描述静止状态)
- 镜头运动方向使用具体描述:camera slowly pushes in / pans right / tilts up / tracks subject
- 每段时长控制在2-5秒(Seedance/即梦的最佳生成区间,超出质量下降)
- 不描述超出AI视频能力的动作(多人复杂互动、快速变形等)
- 使用英文输出,风格标签与图像提示词保持一致

Seedance特有要求(如目标工具是Seedance):
- 场景描述放在前,运动描述放在后
- 明确标注"15 seconds short film style"增强电影质感
- 避免超过3个连续动作的复杂描述(Seedance对长提示词敏感度下降)

输出:所有分镜的视频提示词列表(编号 + 完整英文提示词 + 秒数标注)
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下视频提示词是否存在以下问题:
1. 是否有提示词只描述静止画面,没有运动描述(静止视频不是视频)?
2. 每段时长是否控制在2-5秒(过长会导致质量下降)?
3. 镜头运动描述是否与节点4的镜头设计一致?
4. 是否有动作描述过于复杂,超出AI视频工具的实际能力?

【粘贴视频提示词列表】

逐条说明问题。
D. 返修优化版
根据自查意见修改视频提示词。为静止描述加入运动过程,拆分超时段落,简化复杂动作,对齐镜头运动设计。

原始提示词:【粘贴原始提示词】
自查意见:【粘贴自查结果】

7.5 交付给下游节点

将所有分镜的视频提示词列表复制,同时交给: - 节点 8(配音字幕专家):了解视频节奏,配合设计配音时间点。 - 节点 9(成片审查专家):作为审查分镜完整性的输入材料。

7.6 人工验收清单

  • [ ] 每段视频提示词是否都包含了运动描述(不是纯静止描述)?
  • [ ] 每段时长是否在 2-5 秒之间?
  • [ ] 镜头运动描述是否与节点 4 的设计一致?

节点 8:配音字幕专家

8.1 节点定位

为 15 秒短片生成与画面节奏匹配的配音文案和字幕方案。配音不是原文的朗读,而是对画面的情绪强化——有时候沉默比台词更有力量。这个节点的关键在于"取舍",哪些内容需要说出来,哪些内容让画面说话。

8.2 输入与输出

输入:节点 1 原文解析(旁白素材标注)+ 节点 2 情绪节奏时间表

输出:15 秒配音文案(含旁白和对话,带时间标注)+ 字幕方案(按时间段分行)

8.3 使用顺序

  1. 先用「快速生成版」得到配音文案初稿。
  2. 情感层次复杂或需要中英文字幕时,改用「专家增强版」。
  3. 用「自查审稿版」检查配音是否与画面节奏匹配。
  4. 有问题则用「返修优化版」修正。
  5. 对照 8.6 验收清单确认,通过后交给节点 9。

8.4 提示词包

A. 快速生成版
请根据以下信息,为15秒短片生成配音文案和字幕方案。

原文中的旁白素材:【粘贴节点1标注的"旁白素材"部分】
情绪节奏时间表:【粘贴节点2的时间表】

要求:
- 配音总字数控制在50字以内(15秒内的朗读量)
- 情绪高潮段(11-13秒)可以选择沉默(画面本身说话)
- 字幕每行不超过12字,按时间段分行
B. 专家增强版
你是一位短片配音文案师,专注于将文学语言转化为与画面节奏匹配的音频体验。

任务:为以下15秒短片设计配音文案,取舍有据,让声音和画面共同构成情绪体验。

输入:
- 原文旁白素材(来自节点1):【粘贴标注为"旁白素材"的内容】
- 情绪节奏时间表(来自节点2):【粘贴时间表】
- 视频整体情绪主线:【填入主情绪标签】

设计原则:
- 0-3秒建立段:可以有短旁白引入(不超过10字),也可以沉默配合画面
- 4-10秒发展段:选择性使用旁白,优先选择有画面感的句子
- 11-13秒高潮段:建议沉默或单字/短句(高潮处大量旁白会削弱画面冲击力)
- 14-15秒余韵段:可以有一句收尾旁白(不超过8字)

配音文案要求:
- 每句台词不超过12字(朗读速度约3字/秒)
- 带情绪标注([平静] [压抑] [哽咽] 等)
- 标注停顿位置(用"/"表示节奏停顿,"……"表示情绪停顿)

字幕方案:按时间段分行,每行不超过12字,标注出现时间区间。

输出:配音文案(带时间标注和情绪标注)+ 字幕方案
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下配音文案和字幕方案是否存在以下问题:
1. 配音总字数是否在50字以内(15秒朗读量限制)?
2. 情绪高潮段(11-13秒)是否使用了沉默或短句,而非大段旁白?
3. 是否有读起来绕口或节奏不自然的句子?
4. 字幕每行是否都在12字以内?

【粘贴配音文案和字幕方案】

逐条说明问题。
D. 返修优化版
根据自查意见修改配音文案。压缩总字数,简化高潮段旁白(改为短句或沉默),修正绕口句子,调整字幕分行。

原始文案:【粘贴原始配音文案】
自查意见:【粘贴自查结果】

8.5 交付给下游节点

将配音文案(带时间标注)和字幕方案完整复制,交给节点 9(成片审查专家)。节点 9 将综合检查画面、声音和节奏的整体匹配。

8.6 人工验收清单

  • [ ] 配音总字数是否在 50 字以内?
  • [ ] 情绪高潮段是否使用了沉默或短句(而非大段旁白)?
  • [ ] 字幕每行是否在 12 字以内?

节点 9:成片审查专家

9.1 节点定位

这是一个跨内容的全局审查节点,对完整的 15 秒分镜脚本进行系统性验收,检查视觉连贯性、角色一致性、时长精确性和声画匹配。任何单个节点的自查都无法覆盖跨节点的整体问题,这个节点是最终发稿前的质量关卡。

9.2 输入与输出

输入:所有前序节点的完整输出(场景拆分 + 镜头设计 + 角色词库 + 图像提示词 + 视频提示词 + 配音文案)

输出:成片审查报告(问题清单 + 通过/需修改结论)

9.3 使用顺序

  1. 先用「快速生成版」做快速整体审查。
  2. 需要深度检查跨镜头一致性时,改用「专家增强版」。
  3. 用「自查审稿版」复查审查报告的完整性(可选)。
  4. 审查结论为"通过"后,整合为完整分镜脚本;结论为"需修改"时,返回对应节点修改后重新审查。
  5. 对照 9.6 验收清单确认。

9.4 提示词包

A. 快速生成版
请对以下15秒分镜脚本进行整体审查,检查关键问题。

场景拆分(含总时长):【粘贴节点3的场景表格】
镜头设计:【粘贴节点4的设计摘要】
图像提示词列表:【粘贴节点6的提示词(只看角色固定词部分)】
视频提示词列表(只看时长数字):【粘贴节点7的时长标注】
配音文案(含时间标注):【粘贴节点8的文案】

检查项:
1. 所有场景时长加总是否精确等于15秒?
2. 所有图像提示词中角色固定词是否完全一致?
3. 配音时间点是否与情绪节奏时间表对齐?
4. 是否有视频提示词段落时长超过5秒?

输出:问题清单 + 通过/需修改结论
B. 专家增强版
你是一位AI短视频成品质量审查专家,负责在发布前对分镜脚本进行全面验收。

任务:对以下完整15秒分镜脚本进行系统性审查,从视觉连贯性、角色一致性、节奏匹配三个维度评分。

输入:
- 完整分镜脚本(所有节点输出):【粘贴所有内容】

审查维度:

1. 时长精确性(满分20分)
   - 所有段落时长加总是否精确等于15秒
   - 视频提示词段落是否都在2-5秒区间

2. 角色一致性(满分30分)
   - 所有图像提示词的角色固定词是否完全一致
   - 角色固定词是否包含了足够的区分特征

3. 情绪节奏匹配(满分25分)
   - 高潮段的镜头设计是否匹配情绪强度(特写/推镜)
   - 配音时间点是否与情绪节奏对齐

4. 技术可行性(满分25分)
   - 视频提示词中是否有超出AI工具能力的动作描述
   - 图像提示词格式是否符合目标工具要求

合格线:总分80分。低于80分需要修改对应维度后重新审查。

输出:各维度评分表 + 低分维度的具体问题 + 总体结论(通过/需修改)
C. 自查审稿版

此为当前节点的自查模式,不是新的专家角色。

请检查以下成片审查报告是否存在以下问题:
1. 审查是否只检查了时长和角色词,遗漏了情绪节奏匹配问题?
2. 修改建议是否明确指向了哪个节点的哪个部分需要修改?

【粘贴成片审查报告】
D. 返修优化版
根据成片审查报告中指出的问题,修改对应的分镜内容。每次只修改审查报告指出的最高优先级问题,修改完成后重新送审。

审查报告:【粘贴审查结果】
需要修改的节点:【填入需要返回哪个节点修改】

9.5 交付给下游节点

审查通过后,将所有分镜内容整合为完整分镜脚本包(参见最终输出模板),可直接进入 AI 视频生成阶段。

9.6 人工验收清单

  • [ ] 所有场景段落时长加总是否精确等于 15 秒?
  • [ ] 所有图像提示词中的角色固定词是否完全一致(可逐字对比)?
  • [ ] 视频提示词每段时长是否都在 2-5 秒之间?
  • [ ] 成片审查结论是否为"通过"(结论为"需修改"时必须返回对应节点修改后重新审查)?

节点交接说明

上游节点 交接内容 下游节点
节点 1 原文解析 将情绪标签、场景要素、动作清单完整复制 节点 2
节点 2 情绪节奏 将情绪节奏时间表(精确到秒)复制 节点 3
节点 3 场景拆分 将场景拆分表格复制,同时传给节点 4 和节点 5 节点 4、节点 5
节点 4 镜头设计 将镜头设计方案复制,同时传给节点 5、6、7 节点 5、节点 6、节点 7
节点 5 角色连续性 将角色固定词和快速调用卡复制,传给节点 6 和节点 7 节点 6、节点 7
节点 6 画面提示词 将图像提示词列表复制,传给节点 7 参考 节点 7
节点 7 视频提示词 将视频提示词列表复制,传给节点 8 和节点 9 节点 8、节点 9
节点 8 配音字幕 将配音文案和字幕方案复制,传给节点 9 节点 9
节点 9 成片审查 审查通过后整合所有内容,纳入最终输出模板 最终输出模板

最终输出模板

【原文标题或自定义标题】15秒分镜脚本包

━━ 基础信息 ━━
总时长:15秒
视觉风格:【填入】
目标工具:【填入】

━━ 情绪节奏时间轴 ━━
0:00-0:03  [情绪状态]
0:04-0:10  [情绪状态]
0:11-0:13  [高潮情绪]
0:14-0:15  [余韵情绪]

━━ 角色一致性词库 ━━
主角固定词:[英文固定词组]
快速调用卡:[30字以内核心描述]

━━ 分镜脚本 ━━

场景1:[时间区间] [情绪强度]
环境:[场景描述]
镜头:[景别] + [镜头运动]
图像提示词:
[完整英文图像提示词]
视频提示词:
[完整英文视频提示词,含时长]

场景2:[时间区间] [情绪强度]
(以此类推至全部场景)

━━ 配音文案 ━━
[带时间标注和情绪标注的配音稿]

━━ 字幕方案 ━━
[按时间段分行的字幕内容]

常见错误

错误 1:跳过情绪节奏设计直接拆场景

表现:场景拆分完成后,画面呈现的是"15秒内的平铺直叙",没有情绪起伏,视频看起来像幻灯片而不是短片。

修复:必须先完成节点 2,在确定情绪弧线和高潮时间点后,再根据时长分配来拆分场景,确保情绪高潮出现在第 11-13 秒。

错误 2:不同分镜的角色固定词不一致

表现:同一个角色在第 1 段是棕色眼睛,第 3 段变成蓝色眼睛,第 5 段发型也改变了,AI 生成时每段都是"不同的人"。

修复:必须执行节点 5,在开始生成任何提示词之前建立角色词库,并在节点 6 和节点 7 的每一条提示词中完整复制角色固定词,不能改写或省略。

错误 3:视频提示词描述静止画面

表现:生成的每段视频都只有轻微的画面抖动,没有真正的镜头运动,连接后就是"高清幻灯片"。

修复:执行节点 7 的自查审稿版,确认每段提示词都包含了明确的镜头运动描述(camera pushes in / pans / tracks),而不只是场景描述。


人工验收清单

  • [ ] 所有场景时长加总是否精确等于 15 秒?
  • [ ] 情绪高潮是否出现在第 11-13 秒区间?
  • [ ] 所有分镜提示词中的角色固定词是否完全一致(可逐字比对)?
  • [ ] 视频提示词是否每段都包含了镜头运动描述?
  • [ ] 成片审查是否通过?

延伸玩法

  • 变体 1:30 秒版本:在情绪节奏节点(节点 2)将时间轴扩展为 30 秒,场景数量从 4-6 个增加到 8-10 个,其余节点不变。
  • 变体 2:纯视觉版(无配音):跳过节点 8,在节点 2 的情绪设计中专门为无配音版本增强画面情绪密度,让视觉独立承载所有情绪信息。
  • 进阶组合:与"工作流 05(角色设定工作流)"结合,直接使用角色设定工作流输出的提示词组作为节点 5 角色词库的输入,实现从故事文本到角色设计到视频生成的全链路一体化;与"工作流 04(短剧策划工作流)"结合,将短剧高潮集的场景描述作为本工作流的原始文案,快速生成宣传预告片。