Skip to content

NARRAFILMAI First-Person Video Narrator

上传视频,AI 代入主角视角,一键生成电影感配音解说

NARRAFILM

🔄 工作流程

1
上传视频
拖入 MP4 / MOV / AVI / MKV,系统自动抽帧分析
2
AI 场景理解
Qwen2.5-VL 逐帧分析,识别主角、地点、动作、氛围
3
生成解说稿
DeepSeek-V3 代入"我"的视角,撰写自然流畅的解说词
4
配音 + 字幕
Edge-TTS 合成旁白,ASS 字幕音字同步,电影感输出

🧠 技术栈

模块
模型 / 技术
说明
场景理解
Qwen2.5-VL (72B)
阿里开源,视频帧抽帧分析,主角视角识别
解说生成
DeepSeek-V3
代入"我"视角的生活化解说稿,支持多种情感风格
配音合成
Edge-TTS / F5-TTS
Edge 主流低延迟,F5 零样本音色克隆(2026.03)
字幕对齐
TTS word-level timing
音字精准同步,电影级 ASS 字幕
视频合成
FFmpeg
H.264/H.265 编码,MP4 输出或剪映草稿 JSON

🚀 开始使用

v3.4.0
最新版本
|
MIT
开源协议
|
Python 3.10+
跨平台
|
PySide6
Qt 6.5+

MIT License