首个内置 MCP Server 的 AI 原生远程桌面工具,支持 AI Agent 通过标准协议直接截图、识别、控制远程计算机。
QuickDesk 是一款定位为"AI 原生"的远程桌面软件,其最大特色是在客户端内深度集成了 MCP(Model Context Protocol)Server。通过这一设计,Cursor、Claude Desktop 等 AI 客户端能够直接获取远程机器的屏幕截图、进行 OCR 识别,并执行鼠标点击、键盘输入、剪贴板读写等 40 余种桌面级操作。
AI 集成与 MCP 协议#
- 双传输模式:支持 stdio 模式(AI 客户端拉起进程)与 HTTP/SSE 模式(QuickDesk 托管服务,允许多客户端连接),重启后记忆选择
- 40+ MCP 工具:涵盖截图(可调分辨率加速处理)、鼠标操作(点击/拖拽/滚动)、键盘输入(含快捷键)、剪贴板读写、OCR 文字识别、UI 元素检测、屏幕验证等
- 宿主机 Skill Host:内置系统信息、文件操作、Shell 执行等结构化工具,支持通过添加目录实现自定义技能的自动加载与同步
- 事件驱动机制:提供
wait_for_event、wait_for_screen_change等工具,支持监听连接状态、剪贴板、屏幕变化及性能统计的实时事件流 - MCP Resources 与 Prompts:提供实时设备状态资源,内置 9 个 Prompt 模板(远程操作指南、健康检查、批量自动化、系统诊断等)
- 后台自动化:支持
show_window=false实现无头模式下的批量操作
远程控制与传输#
- Chromium 级底层:基于 Chromium Remoting 协议核心,支持 H.264 / VP8 / VP9 / AV1 多编解码
- WebRTC P2P 传输:支持 ICE/STUN/TURN 穿透,自适应帧率与码率,提供 Office / Gaming 帧率提升模式
- 隐私屏幕模式:远程控制时物理显示器黑屏并阻断本地键鼠输入(需 Windows 10 2004+)
- 交互同步:完整键鼠映射、实时远程光标同步、双向剪贴板同步
连接与运维管理#
- 安全连接机制:9 位设备 ID + 临时访问码(自动刷新周期可配:30分钟至24小时或永不过期)
- 多会话管理:多标签同时连接多台设备,支持连接历史与快速重连
- 全链路性能监控:详细延迟分解面板(Capture → Encode → Network → Decode → Render),实时帧率、码率、带宽及 RTT 统计
架构与实现#
项目采用 C++17(GUI 与 Chromium Remoting 协议核心)、Rust(MCP Bridge 与 Skill Host)和 Go(信令服务器)的多语言架构。在性能优化上,复用了 Chromium 的高度优化 C++ 代码,并结合共享内存与 Qt 6 QVideoSink 实现了从视频采集到 GPU 渲染的零拷贝管线。
核心模块包括:
QuickDesk/:Qt 6 GUI 客户端,采用 MVVM 架构,自建 Fluent Design 组件库quickdesk-mcp/:Rust 编写的 MCP Bridge,负责 stdio 与 WebSocket 之间的协议转换quickdesk-skill-host/:Rust 编写的宿主机技能宿主进程(Cargo workspace)SignalingServer/:Go 语言编写的信令服务器(基于 Gin + GORM)WebClient/:浏览器端 Web 客户端
针对企业需求,提供了完整的自托管方案(Go 信令 + PostgreSQL + Redis + coturn),支持通过 Docker 快速拉起私有化服务,预构建镜像发布至 ghcr.io/barry-ran/quickdesk-signaling。
支持平台#
- Windows x64、macOS ARM64
- Linux 及移动端尚在规划中,无具体时间线
待确认信息#
- 作者真实身份仅为 GitHub 用户
barry-ran,LICENSE 署名 "Barry",无更多公开背景信息 - 独立官网与 Telegram 社群链接未在 README 中提供具体 URL
- Chromium Remoting 代码来源未明确说明是直接引用源码还是独立实现兼容协议
- "首个 AI 原生远程桌面"为项目自身营销定位,缺乏第三方佐证