Skip to content

AI 配置指南

Narrafiilm 支持多个 AI 提供商,按用途分为视频理解和解说生成两个维度。


快速配置

只需配置 DeepSeek API Key 即可完整运行。获取地址:platform.deepseek.com

env
DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx

在应用内:设置 → AI 配置 → 粘贴 Key → 保存 → 连接测试


视频理解模型(场景分析)

提供商模型说明
阿里云百炼Qwen2.5-VL (7B/72B)默认,视频理解 SOTA
OpenAIGPT-4.1多模态,能力强
GoogleGemini 2.5 Flash性价比高

阿里云百炼配置

env
DASHSCOPE_API_KEY=sk-xxxxxxxxxxxxxxxx

在应用中设置 → AI 配置 → 阿里云百炼 → 填入 Key

OpenAI 配置

env
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx
OPENAI_MODEL=gpt-4.1

解说生成模型(文稿撰写)

提供商模型说明
DeepSeekDeepSeek-V3.2默认,性价比最高
OpenAIGPT-4.1最强通用能力
AnthropicClaude Opus 4.6超长上下文
阿里云Qwen2.5-Max中文优化

DeepSeek 配置(默认)

env
DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxx
DEEPSEEK_MODEL=deepseek-chat

Claude 配置

env
ANTHROPIC_API_KEY=sk-ant-xxxxxxxxxxxxxxxx
ANTHROPIC_MODEL=claude-opus-4.6-20260219

配音合成

引擎配置说明
Edge-TTS(默认)无需 Key免费,多音色
F5-TTS需安装零样本克隆
OpenAI TTS需 OpenAI Key超自然语音

Edge-TTS 无需任何配置,开箱即用。


环境变量方式

所有配置也可以通过 .env 文件管理(放在项目根目录,已加入 .gitignore):

env
# DeepSeek(解说生成,默认)
DEEPSEEK_API_KEY=sk-xxx

# 阿里云百炼(视频理解)
DASHSCOPE_API_KEY=sk-xxx

# OpenAI(可选全栈)
OPENAI_API_KEY=sk-xxx

# 配音引擎:edge-tts(默认)/ f5-tts / openai
TTS_ENGINE=edge-tts

多提供商组合建议

场景视频理解解说生成成本
免费入门Qwen2.5-VL(本地)DeepSeek-V3.2接近零
日常创作Qwen2.5-VL(API)DeepSeek-V3.2
最高质量GPT-4.1Claude Opus 4.6

MIT License