首页 AI智能体 Bytebot:开源 AI 桌面代理,11K Stars 自托管让 AI 替你操作电脑

Bytebot:开源 AI 桌面代理,11K Stars 自托管让 AI 替你操作电脑

📅 2026/6/26 👁 阅读 3 🔗 工具访问 0 次 📂 AI智能体

想象一下:你有个虚拟员工,它有自己的电脑、自己的操作系统、自己的工作台。你说一句"把三个供应商网站的最新发票都下载归个档",它就自己打开浏览器、登录网站、下载文件、分文件夹存好。

Bytebot 就是干这个的——一个自托管的 AI 桌面代理。不是浏览器插件,不是 API 套壳,它有一个完整的虚拟桌面。11K+ ⭐ 开源项目。

Bytebot AI桌面代理封面图

是什么

Bytebot 给 AI 配了一台完整的 Ubuntu 虚拟电脑。它能看屏幕、动鼠标、敲键盘、装软件、读文档——像真人一样操作桌面应用。

跟浏览器 Agent 不一样,Bytebot 不受 API 限制。它能操作任何桌面软件:浏览器、邮件客户端、Office、VS Code、命令行。跨系统、跨应用的多步流程,一条自然语言指令搞定。

怎么用

部署:Docker 两步搞定

git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot
echo "ANTHROPIC_API_KEY=sk-ant-..." > docker/.env
docker-compose -f docker/docker-compose.yml up -d

打开 http://localhost:9992 就能看到虚拟桌面。或者一键部署到 Railway。

给任务

直接在 Web UI 里打字:

Bytebot 自己打开浏览器、导航、操作、下载、整理。你在旁边实时看着屏幕。

核心特色

完整的虚拟桌面
Ubuntu + XFCE + Firefox + VS Code + 命令行。不是用浏览器 API 模拟,是真有一个电脑。需要什么软件让它自己装。

多模型支持
Claude、GPT、Gemini 都行。通过 LiteLLM 还能接 Azure、AWS Bedrock、Ollama 本地模型——100+ 供应商。

文件上传与处理
丢 PDF 给 Bytebot,它逐页看完、提取关键信息、交叉对比多份文档。比 API 能拿到的信息量大多了。

密码管理器支持
装 1Password、Bitwarden 到虚拟桌面,Bytebot 能自己填密码、处理 2FA——你不需要给它明文密码。

Takeover 模式
AI 操作到一半你发现它跑偏了?随时接管鼠标键盘把它拉回来,完事再放权。

REST API
脚本调用任务、截图、鼠标点击、文件上传——全部有 API。可以集成到自己的自动化工作流里。

持久化环境
装一次软件永久可用。今天装了个 Chrome 扩展,明天的任务里它还认识。

自托管
数据全在自己的 Docker 里,不出墙。适合对数据安全有要求的企业场景。

真实场景

不是没槽点

同类对比 / 一句话总结

维度 Bytebot Claude Computer Use Browser-use
类型 自托管桌面 Agent API 沙箱 浏览器 Agent
桌面环境 ✅ 完整 Ubuntu 桌面 ⚠ 受限沙箱 ❌ 仅浏览器
部署 Docker 自托管 Anthropic API Python 库
模型 Claude/GPT/Gemini+100+ 仅 Claude 多种 LM
数据隐私 ✅ 完全自托管 ❌ 数据出站 ⚠ 半离线

Bytebot 最值的地方:它把"AI 操作真实电脑"这件事做成了开箱即用的产品,不是 API 示例代码。丢到服务器上就能跑,跑起来就能干活。尤其适合跨系统、多步骤、需要读文档的业务流程自动化。

一句话:如果想让 AI 替你干电脑上的脏活累活,Bytebot 是目前最完整的自托管方案。

GitHub:https://github.com/bytebot-ai/bytebot
官网:https://bytebot.ai


关注我,每期分享一个帮你省事的强大工具 🛠️

💬 评论区 (0 条评论)

暂无评论,快来发表第一条评论吧!

📤 分享这篇文章

📌 相关推荐

微信扫码分享

打开微信扫一扫