发现 AI 代理的未来arrow_forward

Clawd Cursor

calendar_today收录于 2026年2月25日
category智能体与应用工具
code开源
TypeScript工作流自动化桌面应用多模态PlaywrightAI代理智能体框架智能体与应用工具自动化/工作流/RPA计算机视觉/多模态

AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。

Clawd Cursor 是一款开源 AI 桌面代理,让 AI 能够"看屏幕、动鼠标、完成任务"。它通过 5 层智能管道实现跨应用自动化。

核心特性#

  • 5 层降级管道:Browser (CDP) → Action Router → Smart Interaction → Accessibility Reasoner → Screenshot + Vision,低成本优先,逐层降级
  • 多 AI 提供商:Anthropic(推荐复杂任务)、OpenAI、Ollama(本地免费)、Kimi
  • Doctor 自愈:自动检测环境、测试模型、构建最优管道
  • Web Dashboard:浏览器 UI(localhost:3847)用于任务提交、实时日志、安全确认、终止开关
  • 安全分级:Auto(立即执行)→ Preview(先记录再执行)→ Confirm(需用户确认)
  • 隐私保护:REST API 仅绑定本地;Ollama 模式完全离线

适用场景#

  • 跨应用数据迁移(网页 → 桌面应用)
  • 表单填写与网页导航
  • UI 验证与状态检查
  • 批量动作执行
  • 自动化测试/演示

快速开始#

git clone https://github.com/AmrDab/clawd-cursor.git
cd clawd-cursor
npm install && npm run build
npm run doctor
npm start

平台支持#

  • Windows/macOS:全功能支持
  • Linux:仅浏览器层

前置条件#

  • Node.js >= 20
  • macOS 需授予终端"辅助功能"权限

核心依赖#

  • @nut-tree-fork/nut-js(原生桌面控制)
  • playwright(浏览器层与 CDP)
  • sharp(图像处理)
  • express(REST API 与 Dashboard)

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch