你有没有这种经历:有些事情在网页上反复做——查酒店比价、搜房源、批量存图——每次都想「要是能一句话让 AI 帮我在网页上操作就好了」。
better-world-ai/x-cli 做的就是这件事。你告诉 AI agent 一句话需求,它自动给你生成一个 CLI 工具,利用 kimi-webbridge 驱动你本机 Chrome 浏览器的登录态,直接操作真实网页。不需要 API key,不需要写爬虫,不需要折腾 Token。
项目上线一个多月,GitHub 331 星,MIT 开源。仓库里已经收录了 12 个做好的 CLI,覆盖旅行规划、找房租房、高考志愿、批量画图、信息搜索 5 大场景。
x-cli 是什么
一个由 AI agent 生成的 CLI 工具集合,底层依赖 kimi-webbridge——它通过 Playwright/CDP 控制你的 Chrome 浏览器,复现你在网页上的操作流程。
核心思路:你在网页上反复做的事情(查机票、比房价、搜资讯),描述给 AI agent,agent 调用 agent-cli-creator skill,自动生成一个可以复用的 CLI 工具。生成的工具以后随时用,不用每次重新描述。
技术栈:Go 语言,每个 CLI 独立编译,单文件二进制
协议:MIT
前置依赖:kimi-webbridge(驱动 Chrome,装一次全部 CL 场景共用)
现成的 5 大场景
✈️ 一句话规划完整行程
「帮我规划 6 月份去京都的 5 天行程」——ctrip-cli + booking-cli 自动查机票比酒店排动线。不用在携程和 Booking 之间切来切去。
🏠 一次找完几个国家的房
「我在上海张江找两室一厅,月租 5000 以内」——58-cli、anjuke-cli、rightmove-cli(英国)、idealista-cli(西班牙)同时跑一遍,按条件过滤好给你一份对照清单。国内外租房一句话解决。
🎓 高考志愿,数据摆齐再做决定
「我是江苏考生,580 分能上哪些 211」——gaokao-cli 自动拉官方分数线、近三年录取位次、对应专业,排出冲稳保三档。它在替你做选择,而是把你做选择需要的数据摆齐。
🎨 让 AI 画图,不用一张一张右键保存
「画一只穿西装的柴犬,站在 Times Square」——chatgpt-image-cli 直接调用你已登录的 ChatGPT 出图,按命名规则落到本地文件夹。三十张图,等你写完一段文档就在桌面上。
🔍 一个话题搜完、读完、整理完
「搜一下 2025 年值得用的本地 AI 模型,把前 10 篇正文都拿回来」——google-cli + baidu-cli 搜索 + 抓取正文,AI 帮你汇总成摘要或保留原文。
怎么用
前置安装: 先装 kimi-webbridge(所有场景共用)。
https://www.kimi.com/zh-cn/features/webbridge
下载 CLI: 去 GitHub Releases 下载对应平台的二进制文件,解压即可用。macOS 上如果提示「未验证开发者」,跑 xattr -d com.apple.quarantine ./<cli-name>。
装 Skill: 配合 Claude 等 AI agent 使用,安装对应 skill:
npx skills add better-world-ai/x-cli --skill travel-planning
自己做一个新场景: 装 agent-cli-creator skill,对 agent 说一句「帮我给 example.com 做个 CLI」就行。AI 自动分析网页结构、生成 CLI、编译打包。
跟同类怎么比
对比自己写爬虫 / Playwright 脚本: 不用写代码,一句话生成。而且生成的 CLI 可复用,下次直接用。
对比 Browser Use / WebVoyager 等 AI 浏览器操控方案: 那些是实时推理操作,x-cli 是「一次生成、永久复用」的思路。AI 只在生成 CLI 的那一刻调用一次,后面执行 CLI 不消耗推理 Token。
对比传统 API 集成: 很多网站没有 API 或者 API 收费。x-cli 走浏览器自动化的路线,不需要网站提供 API,有账号就能用。
槽点
依赖 kimi-webbridge 和 Chrome。 必须装 kimi-webbridge,而且必须保持 Chrome 登录态。不是纯 CLI 体验。
网页结构变化会导致 CLI 失效。 如果目标网站改版了,CLI 可能跑不通。需要重新让 AI 生成一次。
331 星,项目还很早期。 12 个 CLI 覆盖的场景有限。更多场景需要社区自己用 agent-cli-creator 生成。
走浏览器等于走 UI,速度不如 API。 浏览器操作比 API 调用慢一个数量级。适合偶尔跑一跑的场景,不适合高频批量任务。
一句话总结:如果你经常在网页上做重复操作(查信息、比价、批量保存),又不想写脚本,x-cli 是目前最省事的方案——描述你的需求,AI 给你生成一个可复用的 CLI。
GitHub:better-world-ai/x-cli
agent-cli-creator:better-world-ai/agent-cli-creator