首页 AI智能体 PilotDeck:清华团队开源的 Agent 操作系统,白盒记忆 + 智能路由 + Always-on

PilotDeck:清华团队开源的 Agent 操作系统,白盒记忆 + 智能路由 + Always-on

📅 2026/6/4 👁 阅读 3 🔗 工具访问 0 次
PilotDeck:清华团队开源的 Agent 操作系统,白盒记忆 + 智能路由 + Always-on

工具地址

https://github.com/OpenBMB/PilotDeck

🚀 访问工具

AI Agent 工具这两年出了不少——Claude Code、Cursor、WorkBuddy……各有各的侧重点。但如果你同时跑多个项目,问题就来了:A 项目的记忆会污染 B 项目,Token 账单分不清是哪个任务花的,Agent 下班后就停了等你回来再问。

PilotDeck 是清华 THUNLP 实验室联合 ModelBest、OpenBMB、AI9Stars 推出的开源 Agent 操作系统。它的切入点很明确:面向「长期运行、多项目并行」的生产力场景,不是一次性的问答。

上线一周 GitHub 2,900+ ⭐,AGPL-3.0 开源。

PilotDeck 是什么

一个以 WorkSpace 为核心单元的 Agent 生产力平台。每个项目拥有独立的文件系统、记忆存储和技能集。三个核心能力:白盒记忆、智能路由、Always-on 后台执行。

技术栈:TypeScript,原生支持 MCP 协议。Web / CLI / IM 三端行为一致。

官网:pilotdeck.openbmb.cn(有在线 Demo)

开发方:清华大学自然语言处理实验室(THUNLP)、面壁智能(ModelBest)、OpenBMB、AI9Stars

三个核心能力

WorkSpace 级隔离。 每个项目有自己的文件系统、记忆库和技能。A 项目的排版风格不会漂移到 B 项目。并行工作各自独立,检索范围有界,记忆按项目自然积累而不互相污染。

白盒记忆(White-box Memory)。 这是 PilotDeck 最与众不同的设计。大多数 AI Agent 的记忆是个黑盒——你不知道 AI 记住了什么,错了也没法改。PilotDeck 让你能看到每条记忆条目:什么时候存的、属于哪个 WorkSpace。可以编辑、删除、固定关键决策。还内置了「梦境模式」,在空闲窗口整理记忆,支持一键回滚。

智能路由。 自动判断任务难度:复杂任务走旗舰模型(Claude Sonnet/GPT-4o),简单任务降到轻量模型。实测在小红书运营场景下,开启智能路由后成本从 $12.58 降到 $2.83——节省约 70%。在 7 个复杂任务基准测试中,强主+轻副的路由方案(Sonnet 4.6 + MiniMax-M2.7)以 $3.15 的成本拿到 70.6 分,超过了单一旗舰模型的 $18.36 和 69.1 分。

Always-on 后台执行。 你人走了,Agent 继续跑。自动发现候选任务、运行长期监控、最后把结果落地成文件,等你回来时一份摘要报告已经等着了。打破「你问它答」的回合制模式。

实际效果数据

官方给出的几组数据比较有说服力:

小红书运营场景:智能路由开启后,将简单排版/美化任务降级到 Sonnet 4.5,只在规划节点调用 Opus 4.5。成本 $2.83 vs 全部用 Opus 的 $12.58,节省 77%。

复杂任务基准(7 个多语言推送、数据报告、文献综述等任务):Sonnet 4.6(主)+ MiniMax-M2.7(副)路由方案得分 70.6,成本 $3.15;而单一 Sonnet 4.6 得分 69.1,成本 $18.36——路由方案在更便宜的同时还更好。

白盒记忆:跨项目记忆污染问题得到解决,每项目独立记忆,可审计、可编辑、可回滚。

怎么用

访问官网 pilotdeck.openbmb.cn 可以直接体验在线 Demo。开源部署需自行查看 GitHub 仓库的快速开始文档。

支持 Web 界面、CLI 终端、飞书等 IM 通道。原生支持 MCP 协议,可以接入其他 MCP 兼容的工具。

槽点

项目刚开源(2026.05.28),版本还非常早期。 功能框架已经有了,但文档、社区生态、插件都还在建设阶段。

配置复杂。 要用到智能路由,需要配置多个模型的 API Key。白盒记忆系统的可视化界面也还需要完善。

Always-on 模式消耗资源。 后台持续运行 Agent 意味着持续的 Token 消耗和计算资源。不是所有场景都适合常驻。

生态尚小。 对比 Claude Code 和 Cursor 这些成熟产品,社区贡献、第三方集成还很有限。

一句话总结

如果你管理多个项目、同时跑多种 Agent 任务、对记忆透明度和成本优化有要求,PilotDeck 是当前最值得关注的开源 Agent 平台——清华团队出品,路由和白盒记忆的设计确实有独到之处。

GitHub:OpenBMB/PilotDeck
官方网站:https://pilotdeck.openbmb.cn

💬 评论区 (0 条评论)

暂无评论,快来发表第一条评论吧!

📤 分享这篇文章

📌 相关推荐

微信扫码分享

打开微信扫一扫