一个用于移动自动化和抓取的模型上下文协议(MCP)服务器,支持iOS、Android模拟器、仿真器和真实设备,通过无平台接口实现原生应用交互。
一分钟了解#
Mobile MCP 是一个模型上下文协议(MCP)服务器,它通过统一的接口实现iOS和Android设备的自动化操作。它不需要你分别掌握iOS和Android知识,即可在模拟器、仿真器和真实设备上运行自动化任务。这个服务器允许代理和大型语言模型(LLM)通过结构化的可访问性快照或基于屏幕截图的坐标点击与原生iOS/Android应用和设备交互。
核心价值:消除移动平台间的技术壁垒,让AI助手能够跨平台执行移动设备自动化任务。
快速上手#
安装难度:中 - 需要安装平台工具和配置环境,但通过npx安装简单
# 标准配置
{
"mcpServers": {
"mobile-mcp": {
"command": "npx",
"args": ["-y", "@mobilenext/mobile-mcp@latest"]
}
}
}
适合我的场景吗?
- ✅ 移动应用自动化测试:可以在多种设备上执行UI测试和数据输入场景
- ✅ LLM驱动的用户流程自动化:通过AI代理执行复杂的用户交互流程
- ✅ 跨平台数据提取:从移动应用中提取结构化数据
- ❌ 不需要移动自动化的项目:如果你的应用不涉及移动设备交互,这个工具不适合
核心能力#
1. 设备管理#
- 列出所有可用设备(模拟器、仿真器和真实设备)
- 获取屏幕尺寸和方向信息
- 设置设备方向
实际价值:开发者无需手动切换设备即可管理多个测试环境,提高测试效率
2. 应用管理#
- 列出设备上已安装的应用
- 启动、终止和卸载应用
- 从文件安装应用(.apk, .ipa, .app, .zip)
实际价值:实现应用安装、测试和卸载的全自动化流程,简化应用生命周期管理
3. 屏幕交互#
- 拍摄和保存屏幕截图
- 列出屏幕上的UI元素及其属性和坐标
- 执行点击、双击、长按和滑动操作
实际价值:精确控制应用界面交互,实现复杂的用户操作序列
4. 输入与导航#
- 输入文本并可选择提交
- 按下设备物理按钮(主页、返回、音量等)
- 在设备浏览器中打开URL
实际价值:模拟真实用户操作,完成表单填写、导航和数据输入任务
技术栈与集成#
开发语言:TypeScript, JavaScript (Node.js) 主要依赖:Node.js v22+, Xcode命令行工具, Android平台工具 集成方式:MCP服务器,通过多种IDE和客户端支持
维护状态#
- 开发活跃度:项目有明确的路线图和持续开发计划
- 最近更新:项目处于活跃开发中,有定期功能更新
- 社区响应:感谢所有贡献者,有开源社区支持
文档与学习资源#
- 文档质量:全面 - 包含多种IDE/客户端安装指南、示例提示、架构图和先决条件信息
- 官方文档:Wiki页面可用(在README中引用)
- 示例代码:提供多个工作流示例,如搜索视频、预约课程、检查天气等
平台支持#
- iOS:通过原生可访问性和WebDriverAgent支持模拟器和真实设备
- Android:通过ADB和UI Automator支持仿真器和真实设备
- 跨平台:统一的API可在iOS和Android上工作
系统要求#
- Xcode命令行工具
- Android平台工具
- Node.js v22+
- 支持MCP的基础模型或代理,如Claude MCP、OpenAI Agent SDK、Copilot Studio