首页 AI编程工具 CLI-Anything:让所有软件都变成 AI Agent 可以控制的工具

CLI-Anything:让所有软件都变成 AI Agent 可以控制的工具

📅 2026/6/2 👁 阅读 6 🔗 工具访问 1 次
CLI-Anything:让所有软件都变成 AI Agent 可以控制的工具

工具地址

https://github.com/HKUDS/CLI-Anything

🚀 访问工具

CLI-Anything:让所有软件都变成 AI Agent 可以控制的工具

GitHub 上有一个项目,3 个月拿了 4 万多 Star。增长速度吊打绝大多数开源项目。

它叫 CLI-Anything,来自香港大学数据科学实验室(HKUDS)。做的事情一句话说清楚:给任何软件自动生成 CLI 接口,让 AI Agent 直接控制。

今天软件服务的对象是人。明天软件服务的对象是 AI Agent。CLI-Anything 就是想把这个过渡变得顺滑。

为什么需要这个东西?

现在要让 AI Agent 操控一个软件,通常有三种办法:

GUI Agent。AI 截图看屏幕,模拟鼠标点击。慢,而且屏幕分辨率一变或者界面布局稍微改一下,就翻车。

API 对接。调用 REST API,但并不是每个软件都有 API。Photoshop、FreeCAD、Blender 这些桌面软件,压根没有公开的 REST API。

自己写工具。每个软件都写一个集成工具,不现实,维护成本太高。

CLI-Anything 的方案是:自动生成 CLI。CLI 本来就是给人和机器用的,结构化、可组合、自描述。AI Agent 天然适合跟 CLI 打交道——有 --help 就能自动发现功能,有 JSON 输出就不用做字符串解析。Claude Code 每天跑成千上万条 CLI 命令,已经证明了这条路走得通。

怎么工作的

CLI-Anything 用一套 7 阶段流水线来自动生成 CLI:针对目标软件的能力边界、API 接口、脚本接口做一个自动分析,然后生成带参数校验、JSON 输出、详细帮助文档的生产级 CLI 工具。

流程完全是自动化的。你只需要提供一个 AI 编码 Agent(Claude Code、Pi、OpenClaw、Codex 等等都行),剩下的由框架搞定。

生成的 CLI 还会自动附带 SKILL.md,让 Agent 能够自动发现和安装。

CLI-Hub:现成的生态

项目已经有一个 CLI-Hub 包管理器,装了就能用:

pip install cli-anything-hub

然后你或者你的 Agent 就可以搜索、安装、运行各种软件的 CLI:

cli-hub search image
cli-hub install gimp
cli-hub launch gimp

目前 CLI-Hub 上已经有几十个现成的 CLI,覆盖了从创意工具到开发工具的广泛领域:

如果 CLI-Hub 上没有你要的软件,可以用 CLI-Anything 框架自己生成一个。

效果怎么样

项目放出了不少演示视频:AI Agent 通过生成的 CLI 直接操控 FreeCAD 做 3D 建模、用 Blender 渲染场景、用 Draw.io 画架构图、用 VideoCaptioner 给视频加字幕……全部不经过 GUI,全部通过 CLI 完成。

测试方面也很扎实——2461 个测试全部通过,覆盖单元测试和端到端测试。

兼容的 Agent 平台也很多:Claude Code、Pi、OpenClaw、OpenCode、Codex、Qodercli、GitHub Copilot CLI……基本上主流的编码 Agent 都支持。

安装和使用

两条路:

直接使用现有 CLI:

pip install cli-anything-hub
cli-hub list              # 浏览可用 CLI
cli-hub install blender  # 安装 Blender CLI
cli-hub launch blender   # 启动

让你的 Agent 学会用:

npx skills add HKUDS/CLI-Anything --skill cli-hub-meta-skill -g -y
# 然后告诉 Agent:在 CLI-Hub 找合适的工具,帮我完成这个任务

我的看法

CLI-Anything 抓住了 AI Agent 落地的一个关键问题——Agent 跟现有软件的接口层是真空的。API 不是每个软件都有,GUI Agent 又太脆弱。CLI 恰好是一个平衡点:结构化的同时足够通用。

3 个月 4 万 Star,说明社区对这个问题有强烈的共鸣。而且项目质量看着不错——2400+ 测试、Apache 2.0 协议、活跃的社区贡献(Obsidian、Joplin、n8n 等 CLI 都是社区提交的)。

我觉得最实用的场景是那些「没有 API 的桌面软件」。比如设计师想用 Agent 自动操作 Photoshop 或者 Sketch,开发想用 Agent 控制 Blender 做批量渲染——以前只能靠写脚本或 GUI 自动化,现在装个 CLI 就能搞定。

唯一的限制是它需要上游软件本身已安装(毕竟 CLI 只是接口层,不是替代品)。还有就是项目还在快速迭代中,有些边角的兼容性问题需要时间打磨。

整体来说,CLI-Anything 的路线问题问得对、做得也对。值得关注。

相关链接

💬 评论区 (0 条评论)

暂无评论,快来发表第一条评论吧!

📤 分享这篇文章

📌 相关推荐

微信扫码分享

打开微信扫一扫