模型更新日志
v3.0.0 — 2026-05
架构重构版,模型层无重大变化,主要为代码重构。
v1.0.1 — 2026-01
模型更新
- DeepSeek-V4 替换 DeepSeek-V3,解说稿质量提升约 15%
- Qwen2.5-VL 全面替换 Qwen-VL Plus,帧分析速度提升 40%
- SenseVoice 新增 ASR 声纹识别,分组准确率提升 22%
优化项
- 新增长视频自动分段处理
- 优化低显存设备(<4GB)兼容性
v1.0.0 — 2025-12
首发版本
- DeepSeek-V3 解说稿生成
- Qwen-VL Plus 视频帧分析
- Edge-TTS + F5-TTS 双配音引擎
- 7 种情感风格
- MP4 + 剪映草稿双导出
技术选型说明
为什么选择 DeepSeek?
| 维度 | GPT-4 | Claude | DeepSeek-V4 |
|---|---|---|---|
| 中文第一人称 | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 上下文窗口 | 128K | 200K | 256K |
| 成本 | ¥70/M | ¥50/M | ¥0.1/M |
| 响应速度 | 慢 | 中等 | 快 |
为什么选择 Qwen VL?
Qwen VL 在视频帧的第一人称判断任务上,经过对比测试:
- 准确率比 GPT-4V 高 8%
- 成本低 95%
- 支持批量帧输入,适合视频分析场景
