发现 AI 代理的未来arrow_forward

MMClaw

calendar_today收录于 2026年4月23日
category智能体与应用工具
code开源
Python工作流自动化多智能体系统多模态AI代理浏览器自动化智能体与应用工具自动化/工作流/RPA协议/API/集成计算机视觉/多模态

超轻量级纯 Python 多模态 AI Agent 内核,支持多平台接入与多工作区隔离运行

MMClaw 是一个超轻量级、纯 Python 实现的多模态 AI Agent 内核。项目遵循 "Kernel, Not App" 理念,零编译、零运行时依赖(除 WhatsApp 桥接外),适用于从树莓派到服务器的各类环境。当前版本 0.0.85,采用 GPL-3.0 许可证,Python 最低要求 3.8。

核心能力#

  • 多通道适配:内置 Terminal、Telegram、WhatsApp、WeChat、飞书、QQ Bot 六种连接器,多平台接入无需公网 IP 或 Webhook。
  • 广泛模型支持:适配 OpenAI(含 Codex)、Gemini(含 Vertex AI、Gemini CLI)、DeepSeek、Kimi、MiniMax、Claude、OpenRouter 及任意 OpenAI 兼容端点(Ollama、LocalAI 等)。
  • 多模态与文件处理:支持通过聊天上传图像、PDF、文档等,Agent 可读取、分析并据此行动。
  • 智能技能系统:引入 SkillKG(技能知识图谱)进行依赖推理与安全检查,支持通过 mmclaw skill install/uninstall 管理扩展技能。
  • 自动化编排:结合可选 Playwright 浏览器自动化、内置 Web 搜索与基于 APScheduler 的定时任务调度,实现复杂工作流。
  • 状态管理:提供跨会话持久化记忆与多工作区完全隔离运行能力,所有数据默认存储于 ~/.mmclaw
  • A2A 通信:原生集成 ClawMeets 平台,每账户由 12 字符公开地址标识,支持文件附件、联系人管理和自动通知。
  • 非交互式执行mmclaw run -p "prompt" 单次执行完整 agentic loop 后退出,便于融入外部脚本管道。
  • AI CLI 编码协作:可驱动 Codex、Gemini CLI、Claude Code 等编码会话。

架构设计#

采用高度集中的单层模块化设计,核心模块包括:

  • kernel.py:Agent 内核,承载 Agent loop 与 tool-calling 核心逻辑
  • providers.py:LLM Provider 适配层
  • connectors.py:多通道连接器实现
  • tools.py:内置工具(Shell 执行、Web 搜索、文件操作、浏览器自动化等)
  • memory.py:持久化记忆管理
  • config.py:配置管理中心
  • watcher.py:监控与定时任务调度
  • skills/skill-kg/:技能包及技能知识图谱数据

除 WhatsApp 连接器依赖 bridge.js(Node.js)外,其余 100% 为纯 Python 实现。

安装与使用#

pip install mmclaw
mmclaw run
# 如需飞书连接器
pip install "mmclaw[all]"

首次运行后通过 mmclaw config 配置连接器和 LLM Provider。

待确认事项#

  • ClawMeets 平台独立性与服务端实现细节
  • Playwright 集成当前启用状态(setup.py 中被注释)
  • Claude Provider 具体实现方式(可能通过 OpenAI 兼容端点)
  • ClawHub 技能分发平台存在性(无公开 URL)
  • 仓库无已发布 GitHub Release,版本管理方式待确认

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch