AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。
Clawd Cursor 是一款开源 AI 桌面代理,让 AI 能够"看屏幕、动鼠标、完成任务"。它通过 5 层智能管道实现跨应用自动化。
核心特性#
- 5 层降级管道:Browser (CDP) → Action Router → Smart Interaction → Accessibility Reasoner → Screenshot + Vision,低成本优先,逐层降级
- 多 AI 提供商:Anthropic(推荐复杂任务)、OpenAI、Ollama(本地免费)、Kimi
- Doctor 自愈:自动检测环境、测试模型、构建最优管道
- Web Dashboard:浏览器 UI(localhost:3847)用于任务提交、实时日志、安全确认、终止开关
- 安全分级:Auto(立即执行)→ Preview(先记录再执行)→ Confirm(需用户确认)
- 隐私保护:REST API 仅绑定本地;Ollama 模式完全离线
适用场景#
- 跨应用数据迁移(网页 → 桌面应用)
- 表单填写与网页导航
- UI 验证与状态检查
- 批量动作执行
- 自动化测试/演示
快速开始#
git clone https://github.com/AmrDab/clawd-cursor.git
cd clawd-cursor
npm install && npm run build
npm run doctor
npm start
平台支持#
- Windows/macOS:全功能支持
- Linux:仅浏览器层
前置条件#
- Node.js >= 20
- macOS 需授予终端"辅助功能"权限
核心依赖#
- @nut-tree-fork/nut-js(原生桌面控制)
- playwright(浏览器层与 CDP)
- sharp(图像处理)
- express(REST API 与 Dashboard)