超轻量级纯 Python 多模态 AI Agent 内核,支持多平台接入与多工作区隔离运行
MMClaw 是一个超轻量级、纯 Python 实现的多模态 AI Agent 内核。项目遵循 "Kernel, Not App" 理念,零编译、零运行时依赖(除 WhatsApp 桥接外),适用于从树莓派到服务器的各类环境。当前版本 0.0.85,采用 GPL-3.0 许可证,Python 最低要求 3.8。
核心能力#
- 多通道适配:内置 Terminal、Telegram、WhatsApp、WeChat、飞书、QQ Bot 六种连接器,多平台接入无需公网 IP 或 Webhook。
- 广泛模型支持:适配 OpenAI(含 Codex)、Gemini(含 Vertex AI、Gemini CLI)、DeepSeek、Kimi、MiniMax、Claude、OpenRouter 及任意 OpenAI 兼容端点(Ollama、LocalAI 等)。
- 多模态与文件处理:支持通过聊天上传图像、PDF、文档等,Agent 可读取、分析并据此行动。
- 智能技能系统:引入 SkillKG(技能知识图谱)进行依赖推理与安全检查,支持通过
mmclaw skill install/uninstall管理扩展技能。 - 自动化编排:结合可选 Playwright 浏览器自动化、内置 Web 搜索与基于 APScheduler 的定时任务调度,实现复杂工作流。
- 状态管理:提供跨会话持久化记忆与多工作区完全隔离运行能力,所有数据默认存储于
~/.mmclaw。 - A2A 通信:原生集成 ClawMeets 平台,每账户由 12 字符公开地址标识,支持文件附件、联系人管理和自动通知。
- 非交互式执行:
mmclaw run -p "prompt"单次执行完整 agentic loop 后退出,便于融入外部脚本管道。 - AI CLI 编码协作:可驱动 Codex、Gemini CLI、Claude Code 等编码会话。
架构设计#
采用高度集中的单层模块化设计,核心模块包括:
kernel.py:Agent 内核,承载 Agent loop 与 tool-calling 核心逻辑providers.py:LLM Provider 适配层connectors.py:多通道连接器实现tools.py:内置工具(Shell 执行、Web 搜索、文件操作、浏览器自动化等)memory.py:持久化记忆管理config.py:配置管理中心watcher.py:监控与定时任务调度skills/与skill-kg/:技能包及技能知识图谱数据
除 WhatsApp 连接器依赖 bridge.js(Node.js)外,其余 100% 为纯 Python 实现。
安装与使用#
pip install mmclaw
mmclaw run
# 如需飞书连接器
pip install "mmclaw[all]"
首次运行后通过 mmclaw config 配置连接器和 LLM Provider。
待确认事项#
- ClawMeets 平台独立性与服务端实现细节
- Playwright 集成当前启用状态(setup.py 中被注释)
- Claude Provider 具体实现方式(可能通过 OpenAI 兼容端点)
- ClawHub 技能分发平台存在性(无公开 URL)
- 仓库无已发布 GitHub Release,版本管理方式待确认