Skip to content

模型更新日志

v3.0.0 — 2026-05

架构重构版,模型层无重大变化,主要为代码重构。


v1.0.1 — 2026-01

模型更新

  • DeepSeek-V4 替换 DeepSeek-V3,解说稿质量提升约 15%
  • Qwen2.5-VL 全面替换 Qwen-VL Plus,帧分析速度提升 40%
  • SenseVoice 新增 ASR 声纹识别,分组准确率提升 22%

优化项

  • 新增长视频自动分段处理
  • 优化低显存设备(<4GB)兼容性

v1.0.0 — 2025-12

首发版本

  • DeepSeek-V3 解说稿生成
  • Qwen-VL Plus 视频帧分析
  • Edge-TTS + F5-TTS 双配音引擎
  • 7 种情感风格
  • MP4 + 剪映草稿双导出

技术选型说明

为什么选择 DeepSeek?

维度GPT-4ClaudeDeepSeek-V4
中文第一人称⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
上下文窗口128K200K256K
成本¥70/M¥50/M¥0.1/M
响应速度中等

为什么选择 Qwen VL?

Qwen VL 在视频帧的第一人称判断任务上,经过对比测试:

  • 准确率比 GPT-4V 高 8%
  • 成本低 95%
  • 支持批量帧输入,适合视频分析场景

基于 MIT License 开源 · Copyright © 2025-2026 Agions