Appearance
Director ──► Visual ──► Narration ──► Timing │ ▼ Overlay │ ▼ Render ──► 输出
策划节奏、段落优先级、风格定位。可手动调整。
镜头语义分段 + 关键帧提取。
LLM 生成逐句解说词。
字幕与配音时间轴对齐。
烧字幕 + 视觉叠加层。
FFmpeg 渲染管线。
多比例导出。
累积式 state chain:每步的输入 = 上一步的输出 + 当前步配置。类型安全保证。
type CommentaryPipelineState = { video: VideoMeta; director: DirectorPlan; visual: VisualAnalysisOutput; narration: DraftScript; timing: AlignedSegments; overlay: OverlayPlan; };
详见 script-generation.md。
FFmpeg 调用链:
字幕 SRT/VTT → 烧字幕 → 多轨道合成 → 多比例输出
每步独立可重试:
解说工作流
8 步 Pipeline
1. Director
策划节奏、段落优先级、风格定位。可手动调整。
2. Visual
镜头语义分段 + 关键帧提取。
3. Narration
LLM 生成逐句解说词。
4. Timing
字幕与配音时间轴对齐。
5. Overlay
烧字幕 + 视觉叠加层。
6. Render
FFmpeg 渲染管线。
7. Output
多比例导出。
状态机
累积式 state chain:每步的输入 = 上一步的输出 + 当前步配置。类型安全保证。
脚本生成
详见 script-generation.md。
TTS 合成
渲染管线
FFmpeg 调用链:
失败回退
每步独立可重试:
性能与成本
输入限制