外语视频想转中文字幕,以前得折腾多久?
下视频 → 找个转写工具 → 等 → 导出字幕 → 翻译 → 再找个工具烧进去。中间还要解决格式不兼容、时间戳对不上、翻译质量差一堆问题。一两个小时搭进去,结果字幕还对不上嘴型。
小虎视频翻译(xiaohu-video-translate)把这个流程串成一条全自动流水线。你跟 AI 编程工具说一句「把这个链接翻译成中文字幕视频」,剩下它全自动跑完。
是什么
小虎视频翻译是一套给 AI 编程工具用的技能(Skills),本质是脚本 + 说明书,不绑死任何一家 AI 工具。Claude Code、OpenClaw(小龙虾)、Gemini CLI、Codex 都能用。
装好后你不用记命令,直接说人话就行:
「把这个 YouTube 链接翻译成中文字幕视频」
—— 它自己会按顺序跑完 5 步:
下载 → Whisper 转写 → 翻译 → 润色 → 烧录字幕
你回头的时候,输出目录里已经放好了带中文字幕的视频 + Markdown 文稿。
核心优势
全程本地,零 API 费。 转写用 Whisper(苹果芯片走 MLX + Metal GPU 加速),在你自己电脑里完成。不上传、不收费。翻译复用你已经在用的 AI,不用额外买翻译 API。
字幕质量是真的高。 拿词级时间戳按「句子 + 停顿」切分,字幕不会跑在说话人前面。自动纠正转写听错的专有名词(Claude 被听成 cloud、MCP 被听成 NCP),按语义断句,术语保留英文。
双语字幕有两种选。 纯中文画面干净,中英双语则中文大、英文小,主次分明(用 ASS 字幕做字号反差,SRT 做不到这个),适合顺便练听力。
不挑语言。 英语、日语、韩语、法语、西班牙语……只要 Whisper 听得懂的,都能转成中文字幕。中文视频只做转写和文稿,不走翻译。
怎么用
macOS(尤其是 Apple Silicon)最顺:
brew install yt-dlp ffmpeg
pip3 install --break-system-packages mlx-whisper
git clone https://github.com/xiaohuailabs/xiaohu-video-translate.git
cd xiaohu-video-translate && bash install.sh
装好后对着 AI 工具说:「把这个视频翻译成中文字幕」就行。
另外两个子技能也可以单独用:xiaohu-subtitle-polish 管字幕润色和翻译,xiaohu-video-download 管下载和烧录。
不是没有槽点
目前 macOS 最顺,Linux/Windows 要自己折腾。 核心脚本是 Python 的,Linux 也能跑,但 mlx-whisper 是 Apple Silicon 专用的。非苹果平台要用 faster-whisper 兜底,速度慢一截。
依赖链有点长。 要装 yt-dlp、ffmpeg、Whisper、AI 编程工具本身……初次配置不是一键搞定的事。对小白来说门槛偏高。
AI 编程工具不是人人都有。 这套东西是给 Claude Code / OpenClaw 这类工具用的「技能」。如果你没用这些 AI 编程工具,那就得手动跑脚本,体验差很多。
长视频耗时长。 一小时的视频从头跑到尾可能要十几二十分钟(转写最慢)。不是实时出结果的。
跟同类怎么比
剪映 / 必剪: 有 UI 操作直观,但导出限制多、离线功能弱。小虎赢在「全自动 + 本地 + 不收费」。
在线翻译网站: 上传-等-下载,有的要付费。小虎的流水线一次性跑完,不用人盯。
手动 Whisper + ffmpeg: 对技术强的开发者来说,自己组合这些工具也能达到类似效果,但要写脚本串起来。小虎就是把这条链包装好了,你直接说人话就行。
一句话:如果你已经在用 AI 编程工具,又经常看外语视频想转中文字幕,小虎视频翻译是最省事的方案。
GitHub:https://github.com/xiaohuailabs/xiaohu-video-translate
官方网站:https://github.com/xiaohuailabs/xiaohu-video-translate
标签:#xiaohu-video-translate #视频翻译 #字幕制作 #Whisper #AI编程工具 #本地免费 #中英双语
关注我,每期分享一个帮你省事的强大工具 🛠️