AI Agent 的能力上限取决于它能不能跟真实网页打交道。但现实是:验证码、反爬检测、登录态、API 动态加载……每个网站都是一堵墙。Agent 连页面都打不开,更别说提取数据了。
BrowserAct 就是一个为 AI Agent 设计的浏览器基础设施平台。它的 Skill Forge 框架把任意网站的能力变成可复用的 Agent Skill(技能模块)。Agent 装一个 Skill,就知道怎么跟那个网站交互——搜商品、查数据、填表单,一步到位。

是什么
BrowserAct 是一个面向 AI Agent 的浏览器自动化平台。核心产品线:
- Skill Forge(开源)——三步骤把任意网站变成 Agent 可调用的 Skill
- Browser Infrastructure——Stealth 浏览器、CAPTCHA 自动破解、住宅代理、会话隔离
- n8n 工作流库——社区维护的开源自动化工作流模板
简单说:给 AI Agent 装了一个"能上网的浏览器",而且这个浏览器有隐身衣、有防弹衣、能自动开锁。
Skill Forge:把网站做成 Skill
这是 BrowserAct 最核心的创新。传统的自动化方案需要你写爬虫代码、配置代理、处理反爬——每换一个网站重来一遍。Skill Forge 把这个过程标准化了:
三步流程
- 安装——一条命令装 Skill Forge 到你的 Agent(Claude Code / Cursor / Codex 等都支持)
- 描述目标——告诉 Skill Forge "我要搜索 LinkedIn 旧金山的营销岗位"
- Skill 自动生成——它自动分析网站 API、发现端点、生成 SKILL.md,装进你的 Agent
生成好的 Skill 就是一堆可复用的能力函数,下次直接调。
# 安装 Skill Forge
npx skills add browser-act/skills --skill browser-act-skill-forge
# 使用生成的 Skill(以 LinkedIn 为例)
# Agent 自动发现 linkedin_job_search 能力
# 输入关键词+地点,直接拿结果
Skill Forge 的技术特点
- API 优先——先找网站的隐藏 API 接口,不是渲染页面再解析,快一个数量级
- 完整数据枚举——遍历所有参数取值组合,不漏数据点
- 登录协作——检测到需要登录时,引导用户完成一次认证,后续自动维持
- 自动过验证码——reCAPTCHA、Cloudflare Turnstile、DataDome、HUMAN Security 全自动处理
- Token 高效——一次会话完成整个流程,减少 LLM 调用次数
浏览器基础设施
Skill Forge 能工作的基础是底层一套完整的浏览器引擎:
Stealth 指纹伪装
每次浏览器会话携带独特的指纹(UA、WebRTC、Canvas、WebGL 等 30+ 维度),配合 TLS 指纹轮换和住宅代理 IP,让网站觉得每个请求都是来自不同的真实用户。
三种浏览器模式
- 复用模式——用你本地 Chrome 的登录态(适合需要已登录账号的场景)
- 隐身模式——全隐身私有会话,适合批量采集
- 固定身份模式——固定指纹+IP,适合多账号多会话管理
自动验证码破解
集成了 solve-captcha 引擎,支持:reCAPTCHA v2/v3、Cloudflare Turnstile、DataDome、HUMAN Security 等主流验证码。如果自动过不了,还可以请求人工远程协助(remote-assist),在手机上完成验证后交回 Agent 控制。
无限并发零干扰
每个会话有独立浏览器身份、独立工作区,跑 100 个 Agent 任务也不会互相污染。
n8n 工作流库
BrowserAct 有一个开源社区库(browseract-workflow),提供 8 大类预置的 n8n 工作流模板:
- 🛍️ 电商——价格监控、竞品分析、库存管理
- 📄 内容提取——文章聚合、知识管理
- 📊 金融数据——股票信息、财务报表
- 🎯 社交媒体——趋势跟踪、舆情监控
- 🏢 企业数据——工商信息、招聘信息
- 和其他 3 大类
所有模板免费、开源、即装即用。
跟同类对比
- Browser-Use——也是浏览器 Agent 框架,但偏"Agent 操控浏览器",BrowserAct 更偏"网站能力 Skill 化"
- Playwright/Puppeteer——底层浏览器自动化工具,没有反封锁层和 CAPTCHA 破解,需要自己处理一切
- n8n 自带浏览器节点——只能做简单自动化,没有 Skill 系统、没有隐身浏览器
- 传统爬虫框架(Scrapy 等)——需要大量手动配置,不支持 Agent 调用
一句话总结
BrowserAct Skill Forge 是 AI Agent 上网站"技能化"的最优解——Agent 装一个 Skill 就能跟任意网站交互,底层自带反封锁、过验证码、API 发现、n8n 集成,全流程开源免费。
官网:https://browseract.com
GitHub(API 示例):https://github.com/browser-act/browseract-api-examples
n8n 工作流库:https://github.com/browser-act/browseract-workflow
标签:#BrowserAct #SkillForge #浏览器自动化 #AI Agent #CAPTCHA #反封锁 #n8n #开源
关注我,每期分享一个帮你省事的强大工具 🛠️