工作流概览
PlotCraft 七步工作流将你的故事转化为精美的视频内容。
工作流程图
┌──────────────────────────────────────────────────────────────────────┐
│ PLOTCRAFT 七步工作流 │
├──────────────────────────────────────────────────────────────────────┤
│ │
│ 📥 导入 → 🧠 AI分析 → 📝 脚本生成 → 🎬 分镜设计 │
│ │ │ │ │ │
│ ↓ ↓ ↓ ↓ │
│ 小说/脚本/ 多模型并行 结构化视频 自动分镜图 │
│ 提示词上传 内容分析 脚本输出 含镜头/构图 │
│ │
│ 🎭 角色设计 → 🖼️ 批量渲染 → 📤 导出 │
│ │ │ │ │
│ ↓ ↓ ↓ │
│ AI角色参考图 多模型并行 MP4/WebM/MOV │
│ 种子一致性 场景渲染 字幕+唇形同步 │
│ │
└──────────────────────────────────────────────────────────────────────┘步骤详解
第一步:导入 📥
目的:上传并解析源内容
支持的格式:
| 格式 | 类型 | 扩展名 |
|---|---|---|
| 小说 | 文本 | .txt、.md |
| 脚本 | JSON | .json |
| 提示词 | 文本 | 纯文本 |
AI 自动检测:编码(UTF-8/GBK/GB2312)、章节边界、角色对话
输出:
- 提取的原始内容
- 检测到的内容类型
- 解析的元数据(标题、作者、字数、章节数等)
第二步:AI 分析 🧠
目的:多模型并行理解内容
分析维度:
- 章节结构识别
- 角色关系网络
- 场景类型分类
- 情感基调分析
- 对话密度统计
支持的模型:GLM-5、M2.5、Kimi K2.5、Doubao 2.0、Qwen 2.5、ERNIE 4.0(按需切换)
输出:
- 结构化分析报告
- 角色列表(含关系图)
- 场景分解
- 情感曲线
第三步:脚本生成 📝
目的:生成结构化视频脚本
功能:
- 分镜头脚本(镜头类型、景别、时长)
- 对话台词(带情感标注)
- 场景描述(背景、动作、情绪)
- 旁白/解说词生成
输出:
- 结构化 JSON 脚本
- Markdown 格式分镜文档
第四步:分镜设计 🎬
目的:将脚本转换为可视化分镜
功能:
- AI 自动生成分镜描述
- 镜头角度建议(广角、中景、特写、俯拍等)
- 构图参考
- 时长估算
输出:
- 分镜帧列表
- 场景描述
- 摄像机指令
第五步:角色设计 🎭
目的:设计和管理角色
功能:
- AI 创建角色参考图
- 种子机制确保多场景一致性
- 表情预设(喜、怒、哀、乐等)
- 语音配置(音色、语速、情感)
输出:
- 角色档案(含参考图)
- 表情预设库
- 语音配置
第六步:批量渲染 🖼️
目的:生成视觉资产
支持的模型:
- Seedream 5.0(字节跳动,推荐)
- Kling 1.6(快手)
- Vidu 2.0(生数科技)
功能:
- 多模型并行渲染
- 风格预设(电影感、动漫、插画等)
- 光照/调色预设
- 批量生成场景图、角色肖像、背景素材
输出:
- 高清图像资产
- 资产库管理
第七步:导出 📤
目的:合成并导出最终视频
功能:
- 时间轴编辑器
- 自动转场
- TTS 唇形同步(CosyVoice 2.0、Edge TTS)
- 字幕嵌入
- 多格式导出
输出:
- 格式:MP4、WebM、MOV
- 分辨率:720p、1080p、4K
- 帧率:24/30/60 fps
工作流状态
每个步骤都有状态:
| 状态 | 描述 |
|---|---|
idle | 未开始 |
running | 进行中 |
paused | 用户暂停 |
completed | 成功完成 |
error | 失败并报错 |