工作流 06:从小说文案到 15 秒电影级分镜脚本的 AI 多专家工作流¶
适用岗位:AI 视频创作者、Seedance/即梦用户、短片导演、小说改编视频创作者
真实场景:你有一段小说文字或故事文案(100-300 字),想用 AI 视频工具(Seedance、即梦、Kling)生成一段 15 秒的电影级短片,但不知道如何把文字转化成每个镜头都有明确提示词的分镜脚本。
最终目标:完整的 15 秒分镜脚本,包含:场景拆分方案、每个分镜的镜头设计、角色连续性描述词库、每个分镜的图像提示词和视频提示词(英文)、配音文案和字幕方案。
输入材料清单¶
开始前请准备以下材料:
- 原始小说文案或故事文字(100-300 字,一段完整的情节片段)
- 主角外貌描述(可选,已有角色设定则直接使用)
- 目标视觉风格(写实电影感 / 古风水墨 / 科幻赛博 / 动漫风格)
- 目标工具(Seedance / 即梦 / Kling / Sora,影响提示词格式)
- 是否需要配音(是/否,影响配音文案节点是否执行)
工作流总览¶
节点 1:原文解析专家
↓ 输出:核心情绪 + 场景要素 + 人物动作清单
节点 2:情绪节奏专家
↓ 输出:15秒情绪弧线 + 高潮时间点设计
节点 3:场景拆分专家
↓ 输出:4-6个场景段落(每段约2-4秒)
节点 4:镜头设计专家
↓ 输出:每个场景的景别/运动/切换方式
节点 5:角色连续性专家
↓ 输出:角色一致性描述词库
节点 6:画面提示词专家
↓ 输出:每个分镜的图像生成提示词(英文)
节点 7:视频提示词专家
↓ 输出:每个分镜的视频生成提示词(英文)
节点 8:配音字幕专家
↓ 输出:15秒配音文案 + 字幕方案
节点 9:成片审查专家(跨内容全局审查)
↓ 输出:成片审查报告 + 修改建议
最终交付:完整15秒分镜脚本包
专家节点详解¶
每个节点包含六部分:节点定位、输入与输出、使用顺序、提示词包(A 快速 / B 专家 / C 自查 / D 返修)、交付给下游节点、人工验收清单。
关于节点 9(成片审查专家):这是一个跨内容的全局审查节点,负责检查所有分镜的连贯性、角色一致性和总时长匹配,性质与其他节点的自查审稿版不同——它是对整套分镜脚本进行系统性验收的独立节点。
其他节点的 C 自查审稿版和 D 返修优化版是当前节点内部的工作模式,不是新的专家角色。
节点 1:原文解析专家¶
1.1 节点定位¶
从原始小说文案中提取可视化的核心元素:主要情绪、关键场景、人物动作和环境细节。原文是文字思维,视频是画面思维,这个节点完成从文字到画面的第一次转化。
1.2 输入与输出¶
输入:原始小说文案(100-300 字)
输出:情绪标签(主情绪 + 情绪变化点)+ 场景要素清单(地点/时间/天气/光线)+ 人物动作清单(关键行为)+ 可视化细节清单
1.3 使用顺序¶
- 先用「快速生成版」得到解析结果初稿。
- 原文含有隐喻或意象较多时,改用「专家增强版」。
- 用「自查审稿版」检查提取的元素是否都能被画面呈现。
- 有问题则用「返修优化版」修正。
- 对照 1.6 验收清单确认,通过后交给节点 2。
1.4 提示词包¶
A. 快速生成版¶
你是一位视频分镜师。请从以下小说文案中提取可视化元素。
原始文案:【粘贴小说文案】
输出:
1. 主情绪标签(一个词,例如:悲伤/热烈/压抑/爽快)
2. 情绪变化点(文案中情绪发生转变的位置,一句话说明)
3. 关键场景要素(地点、时间、天气、光线条件)
4. 人物核心动作(3-5个关键行为,每条一句话)
5. 可视化细节(可以成为画面亮点的具体细节描写)
B. 专家增强版¶
你是一位资深影视分镜导演,擅长将文学语言转化为画面语言。
任务:对以下小说文案进行深度视觉化解析,提取所有能被镜头捕捉的元素,剔除无法画面化的纯心理描述。
输入:
- 原始文案:【粘贴小说文案】
解析维度:
1. 情绪弧线(文案开始/中间/结尾各处的情绪标签,构成情绪走向)
2. 空间层次(近景元素/中景元素/远景元素,立体还原场景)
3. 时间线索(白天/夜晚/光线角度,精确到时间段)
4. 动作序列(人物动作按先后顺序排列,每个动作的力度和速度)
5. 视觉焦点(哪些细节在画面中应该被强调,哪些是背景)
6. 无法画面化的内容(心理活动、叙述者视角等,标注为"旁白素材")
约束:所有提取结果必须是可以被摄影机捕捉的画面元素,心理描述必须转化为外化行为或单独标注为旁白。
输出:6个维度的结构化解析报告
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下原文解析是否存在以下问题:
1. 是否有纯心理描写被当作画面元素提取(无法被摄影机捕捉的内容)?
2. 场景要素是否足够具体(不能只写"室外",需要说明具体环境)?
3. 人物动作是否是可执行的具体行为(不能只写"他很痛苦")?
4. 情绪变化点是否有对应的可视化行为或环境变化支撑?
【粘贴原文解析内容】
逐条说明问题。
D. 返修优化版¶
1.5 交付给下游节点¶
将解析结果(情绪标签 + 场景要素 + 动作清单 + 可视化细节)完整复制,交给节点 2(情绪节奏专家)。节点 2 将基于情绪弧线设计 15 秒内的节奏方案。
1.6 人工验收清单¶
- [ ] 所有提取的元素是否都可以被摄影机捕捉(无纯心理描写)?
- [ ] 是否标注了情绪变化的具体位置?
- [ ] 场景要素是否包含了地点、时间、光线三个维度?
节点 2:情绪节奏专家¶
2.1 节点定位¶
将原文的情绪弧线压缩到 15 秒内,设计情绪起伏的节拍时间点和高潮位置。15 秒内节奏设计的核心挑战是:既要让观众感受到情绪变化,又不能因为节奏太密导致视觉疲劳。这个节点是本工作流区别于普通分镜工作流的核心差异点。
2.2 输入与输出¶
输入:节点 1 的情绪标签和情绪变化点
输出:15 秒情绪弧线时间表(每个时间节点的情绪状态)+ 高潮时间点 + 每段时长建议
2.3 使用顺序¶
- 先用「快速生成版」得到情绪节奏初稿。
- 需要精细控制节奏的情绪场景时,改用「专家增强版」。
- 用「自查审稿版」检查情绪节拍是否合理、高潮位置是否有效。
- 有问题则用「返修优化版」调整。
- 对照 2.6 验收清单确认,通过后交给节点 3。
2.4 提示词包¶
A. 快速生成版¶
你是一位视频节奏设计师。请根据以下情绪分析,设计15秒视频的情绪节奏方案。
情绪标签:【粘贴节点1的情绪弧线分析】
输出:
1. 15秒情绪节奏表(每3-4秒一个情绪节点,标注情绪状态)
2. 高潮时间点(情绪最强烈的时刻在第几秒)
3. 开头和结尾的情绪定调
4. 每个情绪段落的建议时长(秒)
B. 专家增强版¶
你是一位专注于短视频情绪设计的剪辑师和导演,深度研究过15秒内制造情绪共鸣的节奏规律。
任务:将以下情绪弧线压缩为15秒内的精确节奏设计,确保情绪起伏清晰可感,同时节奏不过分密集。
输入:
- 情绪弧线分析:【粘贴节点1的完整情绪分析】
- 目标视觉风格:【填入风格,影响节奏基调】
设计原则:
- 0-3秒:情绪建立段(建立基础情绪状态,不能平淡但也不能立即进入最高强度)
- 4-10秒:情绪发展段(情绪主体内容,有1-2次明显的强度变化)
- 11-13秒:情绪高潮段(最强烈的情绪时刻,视觉和音乐配合达到顶点)
- 14-15秒:情绪余韵(一个让情绪慢慢落下或留有余味的收尾画面)
约束:高潮段必须在第11-13秒,不能在最后一秒(没有余韵)也不能在第5秒(后续太平淡)。
输出:精确到秒的情绪节奏表(时间轴格式)+ 每段建议镜头数量 + 高潮段情绪强化建议
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下情绪节奏设计是否存在以下问题:
1. 高潮时间点是否在第11-13秒区间,而不是在最后一秒或前五秒?
2. 是否有连续5秒以上情绪强度几乎没有变化的平淡段落?
3. 开头3秒是否有足够的情绪建立,而不是完全平铺直叙?
4. 结尾是否有情绪余韵设计,而不是戛然而止?
【粘贴情绪节奏设计内容】
逐条说明问题。
D. 返修优化版¶
2.5 交付给下游节点¶
将情绪节奏时间表(含每段时长建议)完整复制,交给节点 3(场景拆分专家)。节点 3 将根据时长建议将文案拆分为对应时长的场景段落。
2.6 人工验收清单¶
- [ ] 情绪高潮是否在第 11-13 秒区间内?
- [ ] 是否有明确的结尾余韵设计(不是戛然而止)?
- [ ] 每个情绪段落的时长是否合理(没有 5 秒以上的平淡段)?
节点 3:场景拆分专家¶
3.1 节点定位¶
将原始文案按照情绪节奏时间表拆分为 4-6 个可拍摄的场景段落,每个场景段落对应一段固定时长。场景拆分决定了每个镜头的内容边界,是后续镜头设计和提示词生成的直接输入。
3.2 输入与输出¶
输入:节点 1 原文解析(场景要素 + 动作清单)+ 节点 2 情绪节奏时间表
输出:4-6 个场景段落(每段:时间区间 + 场景描述 + 核心动作 + 情绪标注)
3.3 使用顺序¶
- 先用「快速生成版」得到场景拆分初稿。
- 场景切换较多或原文节奏复杂时,改用「专家增强版」。
- 用「自查审稿版」检查场景时长和内容量是否匹配。
- 有问题则用「返修优化版」调整。
- 对照 3.6 验收清单确认,通过后交给节点 4。
3.4 提示词包¶
A. 快速生成版¶
你是一位视频分镜师。请将以下文案按照情绪节奏时间表拆分为场景段落。
原文解析:【粘贴节点1的场景要素和动作清单】
情绪节奏时间表:【粘贴节点2的时间表】
输出(每个场景段落):
场景X:[时间区间] | [地点和环境] | [核心动作描述] | [情绪标注]
(共4-6个场景)
B. 专家增强版¶
你是一位影视分镜导演,擅长将短小文案转化为节奏精准的场景拆分方案。
任务:按照以下情绪节奏时间表,将文案内容拆分为场景段落,确保每段的内容量与时长匹配。
输入:
- 原文解析结果:【粘贴节点1的完整解析】
- 情绪节奏时间表:【粘贴节点2的时间表(精确到秒)】
拆分原则:
1. 每个场景段落的时长与情绪节奏时间表对应
2. 场景切换时机与情绪变化点对齐(情绪转折处切场景)
3. 情绪高潮段保持单一场景,不要在高潮处切换场景
4. 每段的内容量评估(2秒的场景不能有超过1个核心动作)
每个场景段落必须包含:
- 精确时间区间(例如:0:00-0:03)
- 场景环境(空间描述+光线条件)
- 核心动作(该段内发生的主要视觉事件)
- 情绪强度(1-5分,对应情绪节奏时间表)
- 镜头数量建议(该段建议用几个镜头完成)
约束:4-6个场景总时长必须精确等于15秒。
输出:场景拆分表格(含5个维度)+ 场景切换逻辑说明
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下场景拆分是否存在以下问题:
1. 所有场景段落时长加总是否精确等于15秒?
2. 是否有单个场景时长只有1秒但包含超过1个核心动作(来不及呈现)?
3. 情绪高潮段是否保持了单一场景,没有在高潮处切换场景?
4. 场景切换点是否与情绪变化点对齐?
【粘贴场景拆分内容】
逐条说明问题。
D. 返修优化版¶
3.5 交付给下游节点¶
将场景拆分表格(含时间区间、环境描述、核心动作、情绪强度)完整复制,同时交给: - 节点 4(镜头设计专家):用于设计每个场景的具体镜头语言。 - 节点 5(角色连续性专家):了解角色在不同场景中的外貌需求。
3.6 人工验收清单¶
- [ ] 所有场景段落时长加总是否精确等于 15 秒?
- [ ] 情绪高潮段是否保持单一场景,没有在高潮处切换?
- [ ] 每个场景的内容量是否与时长匹配(不超载也不空洞)?
节点 4:镜头设计专家¶
4.1 节点定位¶
为每个场景段落设计具体的镜头语言:景别选择、镜头运动方式和场景切换方式。镜头设计是从"拍什么"到"怎么拍"的转化,直接决定画面提示词和视频提示词的核心参数。
4.2 输入与输出¶
输入:节点 3 的场景拆分表格
输出:每个场景的镜头设计方案(景别 + 镜头运动 + 切换方式 + 构图重点)
4.3 使用顺序¶
- 先用「快速生成版」得到镜头设计初稿。
- 需要精确控制情绪强化效果时,改用「专家增强版」。
- 用「自查审稿版」检查景别变化和情绪匹配。
- 有问题则用「返修优化版」调整。
- 对照 4.6 验收清单确认,通过后同时交给节点 5、6、7。
4.4 提示词包¶
A. 快速生成版¶
你是一位分镜导演。请根据以下场景拆分,设计每个场景的镜头方案。
场景拆分:【粘贴节点3的场景表格】
每个场景输出:
景别(远景/全景/中景/近景/特写)
镜头运动(固定/推/拉/横移/跟拍)
切换方式(与上一场景:硬切/淡入/转场)
构图重点(画面焦点在哪里)
B. 专家增强版¶
你是一位电影级短片导演,专注于用有限镜头数量制造最大情绪冲击。
任务:为以下场景拆分设计精确的镜头语言,确保镜头设计强化情绪节奏,而不是随机选择。
输入:
- 场景拆分表格:【粘贴节点3的完整拆分】
- 情绪节奏时间表:【粘贴节点2的时间表,了解每段情绪强度】
设计原则:
- 情绪建立段(0-3秒):全景或中景建立空间感,固定或缓慢推进的镜头
- 情绪发展段(4-10秒):随情绪升高逐渐靠近,切换频率可以加快
- 情绪高潮段(11-13秒):特写或极近景,推镜头或跟拍强化情绪
- 情绪余韵段(14-15秒):拉镜或固定远景,留出画面呼吸感
约束:相邻镜头景别变化不能超过2级(全景不能直接切特写);情绪高潮段不能用固定长镜头。
输出:每个场景的镜头设计卡(景别/运动/切换/构图/情绪匹配说明)
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下镜头设计是否存在以下问题:
1. 情绪高潮段是否使用了推镜或特写,而不是固定远景?
2. 相邻镜头景别变化是否超过2级(例如全景直接切特写)?
3. 是否有连续3个以上相同景别,缺少视觉变化?
4. 余韵段是否有足够的画面呼吸感(不能是快速切换的多镜头)?
【粘贴镜头设计内容】
逐条说明问题。
D. 返修优化版¶
4.5 交付给下游节点¶
将镜头设计方案完整复制,同时交给: - 节点 5(角色连续性专家):了解每个场景中角色的构图位置。 - 节点 6(画面提示词专家):作为图像提示词中的镜头参数来源。 - 节点 7(视频提示词专家):作为视频运动描述的直接依据。
4.6 人工验收清单¶
- [ ] 情绪高潮段是否使用了推镜或特写,而非固定远景?
- [ ] 相邻镜头景别变化是否不超过 2 级?
- [ ] 是否没有连续 3 个以上相同景别?
节点 5:角色连续性专家¶
5.1 节点定位¶
在分镜开始生成提示词之前,建立角色的一致性描述词库,确保角色在所有分镜中外貌保持一致。这是本工作流中的关键质量控制节点——如果跳过这一步,AI 生成的视频中同一个人物在不同镜头里会"换脸"。
5.2 输入与输出¶
输入:主角外貌描述(来自输入材料或来自工作流 05 的角色设定文档)+ 节点 3 场景拆分(了解场景中的着装需求)
输出:角色一致性描述词库(固定外貌词组 + 场景可变词 + 快速调用卡)
5.3 使用顺序¶
- 先用「快速生成版」得到词库初稿。
- 有多个角色或角色在场景中有服装变化时,改用「专家增强版」。
- 用「自查审稿版」检查词库是否足够精确、可变词是否清晰。
- 有问题则用「返修优化版」修正。
- 对照 5.6 验收清单确认,通过后同时交给节点 6 和节点 7。
5.4 提示词包¶
A. 快速生成版¶
你是一位AI绘图提示词工程师。请根据以下角色描述,建立角色一致性描述词库。
角色外貌描述:【填入主角外貌描述,或粘贴工作流05的角色设定输出】
场景列表:【粘贴节点3的场景环境描述摘要】
输出:
1. 固定外貌词组(每次生成该角色时必须包含的英文词汇)
2. 场景可变词(根据场景可以替换的服装/背景词汇)
3. 快速调用卡(30字以内的核心描述词,适合添加到任何提示词前)
B. 专家增强版¶
你是一位专注于AI视频角色连续性的提示词工程师。
任务:为以下角色建立精确的一致性描述词库,确保在所有分镜的图像和视频提示词中,同一角色的外貌始终一致。
输入:
- 角色外貌描述:【填入主角描述或粘贴工作流05输出】
- 场景拆分(了解各场景的外貌需求):【粘贴节点3的场景描述】
词库结构:
1. 固定词(所有场景必须包含):面部特征词 + 发型发色词 + 体型词 + 肤色词
格式:英文词汇,用逗号分隔,总长度不超过50个词
2. 半固定词(通常包含,可根据剧情调整):标志性服装元素 + 特定道具
3. 可变词(根据场景替换):具体场景服装 + 背景 + 光线
4. 负面词(防止AI生成错误外貌):该角色不能出现的外貌特征
特别要求:
- 如有多个角色,为每个角色提供独立词库,并标注区分关键词
- 固定词必须是Midjourney/SD可以理解的标准词汇,不能用中文或自造词
输出:角色词库表格(4个维度)+ 快速调用卡
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下角色一致性词库是否存在以下问题:
1. 固定词是否足够简洁精确(过长会压缩其他描述词的权重)?
2. 固定词是否包含了最能区分该角色的外貌特征(发色、眼睛等)?
3. 可变词和固定词之间是否存在矛盾(例如固定词有long hair,可变词又改了发型)?
4. 是否包含了负面词,防止常见的AI外貌生成错误?
【粘贴角色一致性词库】
逐条说明问题。
D. 返修优化版¶
5.5 交付给下游节点¶
将角色一致性词库(固定词 + 快速调用卡)完整复制,同时交给: - 节点 6(画面提示词专家):在每个图像提示词中加入固定词。 - 节点 7(视频提示词专家):在每个视频提示词中加入固定词。
5.6 人工验收清单¶
- [ ] 固定词是否包含了最能区分角色的外貌特征(发色、眼睛颜色等)?
- [ ] 固定词和可变词之间是否没有矛盾?
- [ ] 是否包含了防止常见生成错误的负面词?
节点 6:画面提示词专家¶
6.1 节点定位¶
为每个分镜生成可直接用于 Midjourney/Stable Diffusion/即梦的图像提示词。图像是视频生成的参考基础,图像提示词的质量直接影响最终视频的画面质量。
6.2 输入与输出¶
输入:节点 3 场景拆分 + 节点 4 镜头设计 + 节点 5 角色一致性词库
输出:每个分镜的完整英文图像提示词(含角色固定词 + 场景描述 + 镜头参数 + 风格标签)
6.3 使用顺序¶
- 先用「快速生成版」得到图像提示词初稿。
- 需要精确的风格一致性或特殊光线处理时,改用「专家增强版」。
- 用「自查审稿版」检查角色固定词是否一致、参数是否完整。
- 有问题则用「返修优化版」修正。
- 对照 6.6 验收清单确认,通过后交给节点 7。
6.4 提示词包¶
A. 快速生成版¶
你是一位AI图像提示词工程师。请为以下分镜生成图像提示词。
场景拆分:【粘贴节点3的场景表格(选择一个场景)】
镜头设计:【粘贴节点4该场景的镜头设计】
角色固定词:【粘贴节点5的快速调用卡】
目标工具:【填入Midjourney v6 / Stable Diffusion】
视觉风格:【填入风格】
提示词格式:
[角色固定词], [动作描述], [场景/背景], [光线], [镜头参数], [风格标签], [质量标签], [画幅参数]
B. 专家增强版¶
你是一位AI图像提示词工程师,专注于电影级分镜图像生成。
任务:为以下所有分镜生成完整的图像提示词,确保风格统一、角色一致、光线匹配情绪。
输入:
- 所有场景拆分:【粘贴节点3的完整表格】
- 镜头设计:【粘贴节点4的完整设计】
- 角色一致性词库:【粘贴节点5的固定词 + 快速调用卡】
- 视觉风格:【填入风格,例如:cinematic film noir / warm golden hour / cold blue atmosphere】
提示词结构(每个分镜):
[角色固定词(每张图必须完全相同)], [当前姿势/动作], [场景环境描述], [光线处理(匹配情绪强度)], [景别和构图(来自节点4)], [视觉风格标签], [质量标签:masterpiece, best quality, ultra detailed], [参数:--ar 9:16 --v 6(Midjourney)]
情绪高潮分镜的光线处理:
- 强烈情绪(悲伤/愤怒/爱):强对比光/逆光/暖色调聚光
- 平静情绪:散射柔光/自然环境光
- 神秘/紧张:冷色调/阴影覆盖面部/局部照明
约束:每个分镜的角色固定词必须完全一致(复制粘贴,不能改写)。
输出:所有分镜的图像提示词列表(编号 + 完整英文提示词)
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下图像提示词是否存在以下问题:
1. 所有分镜中角色固定词是否完全相同(一字不差)?
2. 情绪高潮分镜的光线处理是否与情绪强度匹配(高强度情绪不能用平淡柔光)?
3. 是否每个提示词都包含了景别/构图描述(来自镜头设计)?
4. 是否所有提示词都包含了画幅参数(--ar 9:16 或对应参数)?
【粘贴图像提示词列表】
逐条说明问题。
D. 返修优化版¶
根据自查意见修正图像提示词。统一角色固定词,调整情绪高潮的光线处理,补充缺失的镜头参数和画幅参数。
原始提示词:【粘贴原始提示词列表】
自查意见:【粘贴自查结果】
角色固定词(统一版):【粘贴节点5的固定词】
6.5 交付给下游节点¶
将所有分镜的图像提示词列表(编号 + 完整英文提示词)复制,交给节点 7(视频提示词专家)参考。节点 7 将基于图像提示词的场景描述,加入运动描述生成视频提示词。
6.6 人工验收清单¶
- [ ] 所有分镜的角色固定词是否完全一致(可以逐字对比验证)?
- [ ] 情绪高潮分镜的光线处理是否比其他段落更强烈?
- [ ] 是否每个提示词都包含了景别参数和画幅参数?
节点 7:视频提示词专家¶
7.1 节点定位¶
将分镜的静态描述转化为适合 Seedance/即梦/Kling 等 AI 视频工具的动态提示词,重点描述每个分镜从开始到结束的画面运动过程。视频提示词与图像提示词的核心区别是:视频提示词必须描述运动,而不是静止构图。
7.2 输入与输出¶
输入:节点 4 镜头设计 + 节点 5 角色固定词 + 节点 6 图像提示词(参考场景描述)
输出:每个分镜的视频生成提示词(英文,含场景、运动过程、镜头方向、时长、风格)
7.3 使用顺序¶
- 先用「快速生成版」得到视频提示词初稿。
- 需要更精确的运动描述或针对特定工具优化时,改用「专家增强版」。
- 用「自查审稿版」检查运动描述完整性和时长合理性。
- 有问题则用「返修优化版」修正。
- 对照 7.6 验收清单确认,通过后交给节点 8 和节点 9。
7.4 提示词包¶
A. 快速生成版¶
你是一位AI视频提示词工程师。请为以下分镜生成视频提示词(适用于Seedance/即梦/Kling)。
分镜信息(一个场景):
- 场景描述:【粘贴节点3的场景环境】
- 镜头运动:【粘贴节点4的运动设计】
- 角色固定词:【粘贴节点5的快速调用卡】
- 时长:【填入该段秒数】
提示词格式:
[场景描述], [人物动作], [镜头运动方向], [时长] seconds, [风格], [光线]
示例:A young woman stands in the rain, slowly raises her head to look at the sky, camera gently pushes in from medium shot to close-up, 3 seconds, cinematic, soft blue cold light
B. 专家增强版¶
你是一位AI视频导演,专注于用Seedance/即梦/Kling生成电影级短视频。
任务:为以下所有分镜生成完整的视频生成提示词,重点描述每段画面的运动过程,确保连接后形成连贯的15秒短片。
输入:
- 场景拆分(含时长):【粘贴节点3的完整表格】
- 镜头设计(含运动方式):【粘贴节点4的完整设计】
- 角色固定词:【粘贴节点5的固定词】
- 目标工具:【填入工具名称,影响参数格式】
提示词要求:
- 必须描述从画面开始到结束的完整运动过程(不能只描述静止状态)
- 镜头运动方向使用具体描述:camera slowly pushes in / pans right / tilts up / tracks subject
- 每段时长控制在2-5秒(Seedance/即梦的最佳生成区间,超出质量下降)
- 不描述超出AI视频能力的动作(多人复杂互动、快速变形等)
- 使用英文输出,风格标签与图像提示词保持一致
Seedance特有要求(如目标工具是Seedance):
- 场景描述放在前,运动描述放在后
- 明确标注"15 seconds short film style"增强电影质感
- 避免超过3个连续动作的复杂描述(Seedance对长提示词敏感度下降)
输出:所有分镜的视频提示词列表(编号 + 完整英文提示词 + 秒数标注)
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下视频提示词是否存在以下问题:
1. 是否有提示词只描述静止画面,没有运动描述(静止视频不是视频)?
2. 每段时长是否控制在2-5秒(过长会导致质量下降)?
3. 镜头运动描述是否与节点4的镜头设计一致?
4. 是否有动作描述过于复杂,超出AI视频工具的实际能力?
【粘贴视频提示词列表】
逐条说明问题。
D. 返修优化版¶
7.5 交付给下游节点¶
将所有分镜的视频提示词列表复制,同时交给: - 节点 8(配音字幕专家):了解视频节奏,配合设计配音时间点。 - 节点 9(成片审查专家):作为审查分镜完整性的输入材料。
7.6 人工验收清单¶
- [ ] 每段视频提示词是否都包含了运动描述(不是纯静止描述)?
- [ ] 每段时长是否在 2-5 秒之间?
- [ ] 镜头运动描述是否与节点 4 的设计一致?
节点 8:配音字幕专家¶
8.1 节点定位¶
为 15 秒短片生成与画面节奏匹配的配音文案和字幕方案。配音不是原文的朗读,而是对画面的情绪强化——有时候沉默比台词更有力量。这个节点的关键在于"取舍",哪些内容需要说出来,哪些内容让画面说话。
8.2 输入与输出¶
输入:节点 1 原文解析(旁白素材标注)+ 节点 2 情绪节奏时间表
输出:15 秒配音文案(含旁白和对话,带时间标注)+ 字幕方案(按时间段分行)
8.3 使用顺序¶
- 先用「快速生成版」得到配音文案初稿。
- 情感层次复杂或需要中英文字幕时,改用「专家增强版」。
- 用「自查审稿版」检查配音是否与画面节奏匹配。
- 有问题则用「返修优化版」修正。
- 对照 8.6 验收清单确认,通过后交给节点 9。
8.4 提示词包¶
A. 快速生成版¶
请根据以下信息,为15秒短片生成配音文案和字幕方案。
原文中的旁白素材:【粘贴节点1标注的"旁白素材"部分】
情绪节奏时间表:【粘贴节点2的时间表】
要求:
- 配音总字数控制在50字以内(15秒内的朗读量)
- 情绪高潮段(11-13秒)可以选择沉默(画面本身说话)
- 字幕每行不超过12字,按时间段分行
B. 专家增强版¶
你是一位短片配音文案师,专注于将文学语言转化为与画面节奏匹配的音频体验。
任务:为以下15秒短片设计配音文案,取舍有据,让声音和画面共同构成情绪体验。
输入:
- 原文旁白素材(来自节点1):【粘贴标注为"旁白素材"的内容】
- 情绪节奏时间表(来自节点2):【粘贴时间表】
- 视频整体情绪主线:【填入主情绪标签】
设计原则:
- 0-3秒建立段:可以有短旁白引入(不超过10字),也可以沉默配合画面
- 4-10秒发展段:选择性使用旁白,优先选择有画面感的句子
- 11-13秒高潮段:建议沉默或单字/短句(高潮处大量旁白会削弱画面冲击力)
- 14-15秒余韵段:可以有一句收尾旁白(不超过8字)
配音文案要求:
- 每句台词不超过12字(朗读速度约3字/秒)
- 带情绪标注([平静] [压抑] [哽咽] 等)
- 标注停顿位置(用"/"表示节奏停顿,"……"表示情绪停顿)
字幕方案:按时间段分行,每行不超过12字,标注出现时间区间。
输出:配音文案(带时间标注和情绪标注)+ 字幕方案
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
请检查以下配音文案和字幕方案是否存在以下问题:
1. 配音总字数是否在50字以内(15秒朗读量限制)?
2. 情绪高潮段(11-13秒)是否使用了沉默或短句,而非大段旁白?
3. 是否有读起来绕口或节奏不自然的句子?
4. 字幕每行是否都在12字以内?
【粘贴配音文案和字幕方案】
逐条说明问题。
D. 返修优化版¶
8.5 交付给下游节点¶
将配音文案(带时间标注)和字幕方案完整复制,交给节点 9(成片审查专家)。节点 9 将综合检查画面、声音和节奏的整体匹配。
8.6 人工验收清单¶
- [ ] 配音总字数是否在 50 字以内?
- [ ] 情绪高潮段是否使用了沉默或短句(而非大段旁白)?
- [ ] 字幕每行是否在 12 字以内?
节点 9:成片审查专家¶
9.1 节点定位¶
这是一个跨内容的全局审查节点,对完整的 15 秒分镜脚本进行系统性验收,检查视觉连贯性、角色一致性、时长精确性和声画匹配。任何单个节点的自查都无法覆盖跨节点的整体问题,这个节点是最终发稿前的质量关卡。
9.2 输入与输出¶
输入:所有前序节点的完整输出(场景拆分 + 镜头设计 + 角色词库 + 图像提示词 + 视频提示词 + 配音文案)
输出:成片审查报告(问题清单 + 通过/需修改结论)
9.3 使用顺序¶
- 先用「快速生成版」做快速整体审查。
- 需要深度检查跨镜头一致性时,改用「专家增强版」。
- 用「自查审稿版」复查审查报告的完整性(可选)。
- 审查结论为"通过"后,整合为完整分镜脚本;结论为"需修改"时,返回对应节点修改后重新审查。
- 对照 9.6 验收清单确认。
9.4 提示词包¶
A. 快速生成版¶
请对以下15秒分镜脚本进行整体审查,检查关键问题。
场景拆分(含总时长):【粘贴节点3的场景表格】
镜头设计:【粘贴节点4的设计摘要】
图像提示词列表:【粘贴节点6的提示词(只看角色固定词部分)】
视频提示词列表(只看时长数字):【粘贴节点7的时长标注】
配音文案(含时间标注):【粘贴节点8的文案】
检查项:
1. 所有场景时长加总是否精确等于15秒?
2. 所有图像提示词中角色固定词是否完全一致?
3. 配音时间点是否与情绪节奏时间表对齐?
4. 是否有视频提示词段落时长超过5秒?
输出:问题清单 + 通过/需修改结论
B. 专家增强版¶
你是一位AI短视频成品质量审查专家,负责在发布前对分镜脚本进行全面验收。
任务:对以下完整15秒分镜脚本进行系统性审查,从视觉连贯性、角色一致性、节奏匹配三个维度评分。
输入:
- 完整分镜脚本(所有节点输出):【粘贴所有内容】
审查维度:
1. 时长精确性(满分20分)
- 所有段落时长加总是否精确等于15秒
- 视频提示词段落是否都在2-5秒区间
2. 角色一致性(满分30分)
- 所有图像提示词的角色固定词是否完全一致
- 角色固定词是否包含了足够的区分特征
3. 情绪节奏匹配(满分25分)
- 高潮段的镜头设计是否匹配情绪强度(特写/推镜)
- 配音时间点是否与情绪节奏对齐
4. 技术可行性(满分25分)
- 视频提示词中是否有超出AI工具能力的动作描述
- 图像提示词格式是否符合目标工具要求
合格线:总分80分。低于80分需要修改对应维度后重新审查。
输出:各维度评分表 + 低分维度的具体问题 + 总体结论(通过/需修改)
C. 自查审稿版¶
此为当前节点的自查模式,不是新的专家角色。
D. 返修优化版¶
9.5 交付给下游节点¶
审查通过后,将所有分镜内容整合为完整分镜脚本包(参见最终输出模板),可直接进入 AI 视频生成阶段。
9.6 人工验收清单¶
- [ ] 所有场景段落时长加总是否精确等于 15 秒?
- [ ] 所有图像提示词中的角色固定词是否完全一致(可逐字对比)?
- [ ] 视频提示词每段时长是否都在 2-5 秒之间?
- [ ] 成片审查结论是否为"通过"(结论为"需修改"时必须返回对应节点修改后重新审查)?
节点交接说明¶
| 上游节点 | 交接内容 | 下游节点 |
|---|---|---|
| 节点 1 原文解析 | 将情绪标签、场景要素、动作清单完整复制 | 节点 2 |
| 节点 2 情绪节奏 | 将情绪节奏时间表(精确到秒)复制 | 节点 3 |
| 节点 3 场景拆分 | 将场景拆分表格复制,同时传给节点 4 和节点 5 | 节点 4、节点 5 |
| 节点 4 镜头设计 | 将镜头设计方案复制,同时传给节点 5、6、7 | 节点 5、节点 6、节点 7 |
| 节点 5 角色连续性 | 将角色固定词和快速调用卡复制,传给节点 6 和节点 7 | 节点 6、节点 7 |
| 节点 6 画面提示词 | 将图像提示词列表复制,传给节点 7 参考 | 节点 7 |
| 节点 7 视频提示词 | 将视频提示词列表复制,传给节点 8 和节点 9 | 节点 8、节点 9 |
| 节点 8 配音字幕 | 将配音文案和字幕方案复制,传给节点 9 | 节点 9 |
| 节点 9 成片审查 | 审查通过后整合所有内容,纳入最终输出模板 | 最终输出模板 |
最终输出模板¶
【原文标题或自定义标题】15秒分镜脚本包
━━ 基础信息 ━━
总时长:15秒
视觉风格:【填入】
目标工具:【填入】
━━ 情绪节奏时间轴 ━━
0:00-0:03 [情绪状态]
0:04-0:10 [情绪状态]
0:11-0:13 [高潮情绪]
0:14-0:15 [余韵情绪]
━━ 角色一致性词库 ━━
主角固定词:[英文固定词组]
快速调用卡:[30字以内核心描述]
━━ 分镜脚本 ━━
场景1:[时间区间] [情绪强度]
环境:[场景描述]
镜头:[景别] + [镜头运动]
图像提示词:
[完整英文图像提示词]
视频提示词:
[完整英文视频提示词,含时长]
场景2:[时间区间] [情绪强度]
(以此类推至全部场景)
━━ 配音文案 ━━
[带时间标注和情绪标注的配音稿]
━━ 字幕方案 ━━
[按时间段分行的字幕内容]
常见错误¶
错误 1:跳过情绪节奏设计直接拆场景
表现:场景拆分完成后,画面呈现的是"15秒内的平铺直叙",没有情绪起伏,视频看起来像幻灯片而不是短片。
修复:必须先完成节点 2,在确定情绪弧线和高潮时间点后,再根据时长分配来拆分场景,确保情绪高潮出现在第 11-13 秒。
错误 2:不同分镜的角色固定词不一致
表现:同一个角色在第 1 段是棕色眼睛,第 3 段变成蓝色眼睛,第 5 段发型也改变了,AI 生成时每段都是"不同的人"。
修复:必须执行节点 5,在开始生成任何提示词之前建立角色词库,并在节点 6 和节点 7 的每一条提示词中完整复制角色固定词,不能改写或省略。
错误 3:视频提示词描述静止画面
表现:生成的每段视频都只有轻微的画面抖动,没有真正的镜头运动,连接后就是"高清幻灯片"。
修复:执行节点 7 的自查审稿版,确认每段提示词都包含了明确的镜头运动描述(camera pushes in / pans / tracks),而不只是场景描述。
人工验收清单¶
- [ ] 所有场景时长加总是否精确等于 15 秒?
- [ ] 情绪高潮是否出现在第 11-13 秒区间?
- [ ] 所有分镜提示词中的角色固定词是否完全一致(可逐字比对)?
- [ ] 视频提示词是否每段都包含了镜头运动描述?
- [ ] 成片审查是否通过?
延伸玩法¶
- 变体 1:30 秒版本:在情绪节奏节点(节点 2)将时间轴扩展为 30 秒,场景数量从 4-6 个增加到 8-10 个,其余节点不变。
- 变体 2:纯视觉版(无配音):跳过节点 8,在节点 2 的情绪设计中专门为无配音版本增强画面情绪密度,让视觉独立承载所有情绪信息。
- 进阶组合:与"工作流 05(角色设定工作流)"结合,直接使用角色设定工作流输出的提示词组作为节点 5 角色词库的输入,实现从故事文本到角色设计到视频生成的全链路一体化;与"工作流 04(短剧策划工作流)"结合,将短剧高潮集的场景描述作为本工作流的原始文案,快速生成宣传预告片。