基于 CDP 直连的浏览器自动化 MCP 服务器,内建 27 个智能子系统约束 AI 代理行为,支持多标签页并行、Token 压缩与反检测。
OpenChrome 是一个开源的浏览器自动化 MCP(Model Context Protocol)服务器,允许 AI 代理通过 Chrome DevTools Protocol 直接控制真实 Chrome 浏览器,零中间件层。项目核心差异化在于其 "Harness Engineering" 体系——围绕浏览器 API 构建的 27 个智能子系统(分引导、韧性、保护、反馈、学习、优化、检测 7 大类),在错误级联前预防问题、自动恢复故障、阻止 token 消耗失控。
OpenChrome 提供 46 个 MCP 工具,覆盖导航交互、页面读取(支持 accessibility tree / dom / css 三种模式)、环境控制、存储调试、并行工作流和跨会话记忆。其中 DOM Mode 通过 15x 压缩率显著降低 token 开销。反检测方面采用真实 Chrome 指纹,内置 3 级自动回退链及 Cloudflare Turnstile/CDN-WAF 绕过支持。支持 1 进程 N 标签页并行(据称 20 会话约 300MB),会话持久化可跨重启保持登录状态。技术栈为 TypeScript + Node.js(≥18),CDP 通信基于 rebrowser-puppeteer-core,构建使用 Webpack,测试使用 Jest。除 CLI 外提供 Beta 阶段的跨平台桌面应用(macOS/Windows/Linux)。
智能约束系统(Harness Engineering)#
| 类别 | 关键子系统 | 作用 |
|---|---|---|
| 引导 | Hint Engine(30+ 规则、9 类)、Progress Tracker、Usage Guide | 在错误级联发生前预防 |
| 韧性 | Ralph Engine(7 策略瀑布流)、Auto-Reconnect、Ref Self-Healing | 故障自动恢复 |
| 保护 | 3 级 Circuit Breaker、Rate Limiter、Domain Guard | 阻止 token 消耗失控 |
| 反馈 | Outcome Classifier、DOM Delta、Visual Summary、Hit Detection | 报告操作实际结果 |
| 学习 | Pattern Learner、Strategy Learner、Domain Memory | 跨会话智能提升 |
| 优化 | DOM Mode(15x 压缩)、Adaptive Screenshot、Snapshot Delta | 最小化 token 消耗 |
| 检测 | Auth Redirect Detection、Blocking Page、Pagination Detector | 早期识别异常页面状态 |
MCP 工具集(46 个,6 大类)#
- 导航与交互:
navigate、interact、fill_form、find、computer - 读取与提取:
read_page(accessibility tree / dom / css 模式)、page_content、javascript_tool、selector_query、xpath_query - 环境控制:
emulate_device、geolocation、user_agent、network - 存储与调试:
cookies、storage、console_capture、performance_metrics、request_intercept - 并行工作流:
workflow_init、workflow_collect、worker_create、batch_execute - 记忆:
memory_record、memory_query、memory_validate
快速开始#
npx openchrome-mcp setup # 自动配置 Claude Code
npx openchrome-mcp setup --client codex # 自动配置 Codex CLI
oc serve --auto-launch # 启动服务器
oc serve --headless-shell # 无头模式
oc doctor # 诊断问题
待确认信息#
- npm 包
openchrome-mcp发布状态未直接验证 - 桌面应用框架(Tauri 或 Electron)未确认
- 性能基准数据("80x faster"、"5x cheaper" 等)为项目自述,未经独立验证
- 49 个可靠性机制完整清单未在 README 中完全列出