MMClaw

超轻量级纯 Python 多模态 AI Agent 内核，支持多平台接入与多工作区隔离运行

MMClaw 是一个超轻量级、纯 Python 实现的多模态 AI Agent 内核。项目遵循 "Kernel, Not App" 理念，零编译、零运行时依赖（除 WhatsApp 桥接外），适用于从树莓派到服务器的各类环境。当前版本 0.0.85，采用 GPL-3.0 许可证，Python 最低要求 3.8。

核心能力#

多通道适配：内置 Terminal、Telegram、WhatsApp、WeChat、飞书、QQ Bot 六种连接器，多平台接入无需公网 IP 或 Webhook。
广泛模型支持：适配 OpenAI（含 Codex）、Gemini（含 Vertex AI、Gemini CLI）、DeepSeek、Kimi、MiniMax、Claude、OpenRouter 及任意 OpenAI 兼容端点（Ollama、LocalAI 等）。
多模态与文件处理：支持通过聊天上传图像、PDF、文档等，Agent 可读取、分析并据此行动。
智能技能系统：引入 SkillKG（技能知识图谱）进行依赖推理与安全检查，支持通过 mmclaw skill install/uninstall 管理扩展技能。
自动化编排：结合可选 Playwright 浏览器自动化、内置 Web 搜索与基于 APScheduler 的定时任务调度，实现复杂工作流。
状态管理：提供跨会话持久化记忆与多工作区完全隔离运行能力，所有数据默认存储于 ~/.mmclaw。
A2A 通信：原生集成 ClawMeets 平台，每账户由 12 字符公开地址标识，支持文件附件、联系人管理和自动通知。
非交互式执行：mmclaw run -p "prompt" 单次执行完整 agentic loop 后退出，便于融入外部脚本管道。
AI CLI 编码协作：可驱动 Codex、Gemini CLI、Claude Code 等编码会话。

架构设计#

采用高度集中的单层模块化设计，核心模块包括：

kernel.py：Agent 内核，承载 Agent loop 与 tool-calling 核心逻辑
providers.py：LLM Provider 适配层
connectors.py：多通道连接器实现
tools.py：内置工具（Shell 执行、Web 搜索、文件操作、浏览器自动化等）
memory.py：持久化记忆管理
config.py：配置管理中心
watcher.py：监控与定时任务调度
skills/ 与 skill-kg/：技能包及技能知识图谱数据

除 WhatsApp 连接器依赖 bridge.js（Node.js）外，其余 100% 为纯 Python 实现。

安装与使用#

pip install mmclaw
mmclaw run
# 如需飞书连接器
pip install "mmclaw[all]"

首次运行后通过 mmclaw config 配置连接器和 LLM Provider。

待确认事项#

ClawMeets 平台独立性与服务端实现细节
Playwright 集成当前启用状态（setup.py 中被注释）
Claude Provider 具体实现方式（可能通过 OpenAI 兼容端点）
ClawHub 技能分发平台存在性（无公开 URL）
仓库无已发布 GitHub Release，版本管理方式待确认

核心能力#

架构设计#

安装与使用#

待确认事项#

相关项目

Membrane

FireRed-OpenStoryline

api2mcp4j

保持更新