AI 编程助手已经烂大街了。但你有没有想过——用聊天窗口剪视频?
browser-use 团队(就是那个 65K 星的开源浏览器操控框架)上个月又整了个活:video-use,一个能让你用 Claude Code、Codex 等编码 Agent 直接剪视频的开源工具。上线才两个月,GitHub 12.9K 星。

是什么
video-use 做的事就一句话:把原始素材丢进文件夹,跟 AI Agent 说"帮我剪成一条视频",它就给你吐出 final.mp4。
支持任何内容——口播、教程、游记、访谈、混剪。不需要学剪辑软件,不需要拖时间线,不需要记快捷键。
目前依赖 Claude Code、Codex、Hermes、OpenCode 这类带 shell 权限的编码 Agent。v0.1,完全开源(MIT)。
怎么做到的?LLM 不"看"视频
大多数人第一反应:给 LLM 逐帧分析?那 token 爆了。
video-use 的思路跟 browser-use 一脉相承——不给 AI 原始像素,给结构化数据。
它有两层读取方式:
第一层:文本转录(总是加载)
用 ElevenLabs Scribe 做语音识别,拿到逐词时间戳 + 说话人识别 + 音频事件(笑声、掌声、叹气)。所有素材打包成一个 12KB 左右的 Markdown 文件,LLM 把"看视频"变成了"读剧本":
## C0103 (duration: 43.0s, 8 phrases)
[002.52-005.36] S0 Ninety percent of what a web agent does is completely wasted.
[006.08-006.74] S0 We fixed this.
第二层:时间线快照(按需调用)
只有在需要确认具体画面时(比如犹豫该不该切的停顿、前后两条 NG 的对比),才生成一张胶片条 + 波形 + 词标签的合成图。
对比一个粗暴做法:30,000 帧 × 1,500 tokens = 45M tokens 的噪音。video-use 只要 12KB 文本 + 几张 PNG。
核心能力
✂️ 智能裁剪
自动掐掉 umm、uh、啊、那个,以及镜头间的死沉默。30ms 音频淡入淡出,不会听到"噗"的爆音。
🎨 自动调色
内置暖色电影风、中性清晰风,你也可以自己写 ffmpeg 调色链。
💬 字幕烧录
默认 2 词一分的大写风格,全可自定义。
🔄 动画叠加
通过 HyperFrames、Remotion、Manim、PIL 生成动画覆盖层——支线 Agent 并行跑,每个动画一个子任务。
✅ 自评估循环
渲染完自动检查每个剪切点:画面跳不跳、音频突不突、字幕漏没漏。最多自我修正 3 轮,通过了才给你看预览。
💾 会话记忆
每次剪辑记录在 project.md 里。下周接着干,AI 还记着你的风格偏好。
怎么用
装起来不算复杂,但比传统 NLE 软件轻太多了:
git clone https://github.com/browser-use/video-use ~/Developer/video-use
ln -sfn ~/Developer/video-use ~/.claude/skills/video-use
cd ~/Developer/video-use
uv sync
brew install ffmpeg
然后丢素材进文件夹,启动 Agent,跟它说"帮我剪一条发布视频"。Agent 会先分析素材、给方案,你确认后才动手。
所有产物在 素材文件夹/edit/ 里,skill 目录干干净净。
不是没有槽点
依赖 ElevenLabs 的 API Key。 转录这一步必须走 ElevenLabs Scribe,不是免费的。你要用别的 ASR 得自己改 pipeline。
需要编码 Agent。 不是什么 AI 工具都能用。目前只支持 Claude Code、Codex、Hermes、OpenCode 这类 CLI Agent。普通用户可能被劝退。
v0.1 还糙。 文档不够全,某些边缘情况会炸(比如纯音乐无对白片段)。社区 issue 里不少人反馈安装步骤有坑。
纯命令行。 没有图形界面。虽然这本身就是卖点,但习惯拖时间线的人会觉得反人性。
跟同类怎么比
市面上 AI 视频工具不少,但思路完全不同:
- Descript:GUI 为主,AI 辅助。收费,闭源。
- Runway ML:Web 端,AI 生成+编辑。专业向,月费起步。
- video-use:纯 Agent 驱动。完全开源。免费(除了 API 调用费)。
类比:Premiere 之于 Descript,就像 Photoshop 之于 video-use。不是同一个物种,但目标一样——帮你更快剪出好视频。
一句话总结
如果你本身就用 Claude Code 这类 Agent 干活,video-use 能把视频剪辑也加进你的工作流。它不适合想摆脱终端的人,但适合已经住在终端里的人。
GitHub:browser-use/video-use ⭐12.9K
标签:#video-use #AI视频 #Agent剪辑 #browseruse #ClaudeCode #开源视频工具
关注我,每期分享一个帮你省事的强大工具 🛠️