首页 用 Claude Code 剪视频:video-use 把 AI Agent 变成剪辑师

用 Claude Code 剪视频:video-use 把 AI Agent 变成剪辑师

📅 2026/7/1 👁 阅读 2 🔗 工具访问 0 次

AI 编程助手已经烂大街了。但你有没有想过——用聊天窗口剪视频?

browser-use 团队(就是那个 65K 星的开源浏览器操控框架)上个月又整了个活:video-use,一个能让你用 Claude Code、Codex 等编码 Agent 直接剪视频的开源工具。上线才两个月,GitHub 12.9K 星。

video-use 封面

是什么

video-use 做的事就一句话:把原始素材丢进文件夹,跟 AI Agent 说"帮我剪成一条视频",它就给你吐出 final.mp4

支持任何内容——口播、教程、游记、访谈、混剪。不需要学剪辑软件,不需要拖时间线,不需要记快捷键。

目前依赖 Claude Code、Codex、Hermes、OpenCode 这类带 shell 权限的编码 Agent。v0.1,完全开源(MIT)。

怎么做到的?LLM 不"看"视频

大多数人第一反应:给 LLM 逐帧分析?那 token 爆了。

video-use 的思路跟 browser-use 一脉相承——不给 AI 原始像素,给结构化数据

它有两层读取方式:

第一层:文本转录(总是加载)
用 ElevenLabs Scribe 做语音识别,拿到逐词时间戳 + 说话人识别 + 音频事件(笑声、掌声、叹气)。所有素材打包成一个 12KB 左右的 Markdown 文件,LLM 把"看视频"变成了"读剧本":

## C0103  (duration: 43.0s, 8 phrases)
  [002.52-005.36] S0 Ninety percent of what a web agent does is completely wasted.
  [006.08-006.74] S0 We fixed this.

第二层:时间线快照(按需调用)
只有在需要确认具体画面时(比如犹豫该不该切的停顿、前后两条 NG 的对比),才生成一张胶片条 + 波形 + 词标签的合成图。

对比一个粗暴做法:30,000 帧 × 1,500 tokens = 45M tokens 的噪音。video-use 只要 12KB 文本 + 几张 PNG。

核心能力

✂️ 智能裁剪
自动掐掉 umm、uh、啊、那个,以及镜头间的死沉默。30ms 音频淡入淡出,不会听到"噗"的爆音。

🎨 自动调色
内置暖色电影风、中性清晰风,你也可以自己写 ffmpeg 调色链。

💬 字幕烧录
默认 2 词一分的大写风格,全可自定义。

🔄 动画叠加
通过 HyperFrames、Remotion、Manim、PIL 生成动画覆盖层——支线 Agent 并行跑,每个动画一个子任务。

✅ 自评估循环
渲染完自动检查每个剪切点:画面跳不跳、音频突不突、字幕漏没漏。最多自我修正 3 轮,通过了才给你看预览。

💾 会话记忆
每次剪辑记录在 project.md 里。下周接着干,AI 还记着你的风格偏好。

怎么用

装起来不算复杂,但比传统 NLE 软件轻太多了:

git clone https://github.com/browser-use/video-use ~/Developer/video-use
ln -sfn ~/Developer/video-use ~/.claude/skills/video-use
cd ~/Developer/video-use
uv sync
brew install ffmpeg

然后丢素材进文件夹,启动 Agent,跟它说"帮我剪一条发布视频"。Agent 会先分析素材、给方案,你确认后才动手。

所有产物在 素材文件夹/edit/ 里,skill 目录干干净净。

不是没有槽点

依赖 ElevenLabs 的 API Key。 转录这一步必须走 ElevenLabs Scribe,不是免费的。你要用别的 ASR 得自己改 pipeline。

需要编码 Agent。 不是什么 AI 工具都能用。目前只支持 Claude Code、Codex、Hermes、OpenCode 这类 CLI Agent。普通用户可能被劝退。

v0.1 还糙。 文档不够全,某些边缘情况会炸(比如纯音乐无对白片段)。社区 issue 里不少人反馈安装步骤有坑。

纯命令行。 没有图形界面。虽然这本身就是卖点,但习惯拖时间线的人会觉得反人性。

跟同类怎么比

市面上 AI 视频工具不少,但思路完全不同:

类比:Premiere 之于 Descript,就像 Photoshop 之于 video-use。不是同一个物种,但目标一样——帮你更快剪出好视频。

一句话总结

如果你本身就用 Claude Code 这类 Agent 干活,video-use 能把视频剪辑也加进你的工作流。它不适合想摆脱终端的人,但适合已经住在终端里的人。

GitHub:browser-use/video-use ⭐12.9K

标签:#video-use #AI视频 #Agent剪辑 #browseruse #ClaudeCode #开源视频工具


关注我,每期分享一个帮你省事的强大工具 🛠️

💬 评论区 (0 条评论)

暂无评论,快来发表第一条评论吧!

📤 分享这篇文章

微信扫码分享

打开微信扫一扫