Skip to content

快速上手

环境要求

RequirementVersionNotes
Node.js18+Frontend build
Rust1.70+Tauri backend
pnpm8+Package manager
FFmpegLatestVideo frame extraction
GitAnySource clone

安装

bash
# Clone the repository
git clone https://github.com/Agions/SubLens.git
cd SubLens

# Install frontend dependencies
pnpm install

# Run in development mode (Rust backend auto-builds on first run)
pnpm tauri dev

# Build production package
pnpm tauri build

OCR 引擎

SubLens 支持三种 OCR 引擎:

EngineTechnologyAccuracySpeedLanguages
EasyOCRPyTorch⭐⭐⭐ Best(字幕场景)Medium80+
PaddleOCRPP-OCRv5 Deep Learning⭐⭐⭐ 高精度Fast(GPU)80+
Tesseract.jsLSTM + WASM⭐⭐ GoodFastest100+

字幕属于「自然场景文字」,EasyOCR 在这类场景表现最优,推荐优先使用。PaddleOCR 适合 GPU 用户追求极限精度;Tesseract.js 适合无 Python 环境的快速上手。

GPU 加速(可选)

NVIDIA GPU 可显著加速 PaddleOCR:

bash
# NVIDIA CUDA
conda install cudatoolkit=11.8 -c nvidia
pip install paddlepaddle-gpu

切换到 PaddleOCR 引擎后,SubLens UI 会自动使用 GPU(需已安装 GPU 版 PaddleOCR)。

首次提取

第一步 — 打开视频

点击工具栏 Open,或直接将视频文件拖入窗口。

支持格式:MP4 · MKV · AVI · MOV · WebM

第二步 — 选择字幕区域(ROI)

选择一个预设或拖动定义字幕区域:

Preset适用场景
Bottom大多数硬字幕
Top片头/片尾字幕
Left / Right双语字幕
Center对话叠加字幕
Custom自由选择

第三步 — 配置 OCR

Setting推荐
OCR EnginePaddleOCR(精度最高)
Languages选择字幕对应语言
Confidence threshold70% — 根据效果调整
Multi-pass OCR启用(复杂字幕效果更好)
Text post-processing启用(输出更干净)
Subtitle merge启用(80% 相似度去重)

第四步 — 开始提取

点击 Start Extraction,进度显示在 Progress 标签页。

第五步 — 导出

点击字幕面板的 Export,选择导出格式:

FormatFrame-mappedBest for
SRTNo通用字幕播放器
WebVTTNoWeb 视频
ASSNo动漫字幕(高级样式)
JSONYes帧级精确编辑
CSVYes电子表格分析
TXTNo纯文本

基于 MIT 许可证发布。