模型更新日志

v3.0.0 — 2026-05

架构重构版，模型层无重大变化，主要为代码重构。

v1.0.1 — 2026-01

模型更新

DeepSeek-V4 替换 DeepSeek-V3，解说稿质量提升约 15%
Qwen2.5-VL 全面替换 Qwen-VL Plus，帧分析速度提升 40%
SenseVoice 新增 ASR 声纹识别，分组准确率提升 22%

优化项

新增长视频自动分段处理
优化低显存设备（<4GB）兼容性

v1.0.0 — 2025-12

首发版本

DeepSeek-V3 解说稿生成
Qwen-VL Plus 视频帧分析
Edge-TTS + F5-TTS 双配音引擎
7 种情感风格
MP4 + 剪映草稿双导出

技术选型说明

为什么选择 DeepSeek？

维度	GPT-4	Claude	DeepSeek-V4
中文第一人称	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
上下文窗口	128K	200K	256K
成本	¥70/M	¥50/M	¥0.1/M
响应速度	慢	中等	快

为什么选择 Qwen VL？

Qwen VL 在视频帧的第一人称判断任务上，经过对比测试：

准确率比 GPT-4V 高 8%
成本低 95%
支持批量帧输入，适合视频分析场景