融合 VRM 虚拟形象、计算机控制、多平台通讯机器人与浏览器自动化的 All-in-one 桌面 AI 伴侣与多智能体平台。
Super Agent Party 是一个 All-in-one 桌面 AI 伴侣与多智能体平台,当前版本 v0.4.0,由 heshengtao 维护,采用 AGPL-3.0 许可证。
平台以 VRM 桌面宠物机器人为特色入口,支持自定义 3D/2D 虚拟形象、语音交互、对话打断、OBS 透明串流及双向 VMC 协议。核心能力涵盖四大方向:
桌面与浏览器控制 — 通过视觉识别 + 鼠标键盘工具链实现 AI 自动操控计算机,并为 Agent 配备基于 LLM 视觉推理的独立浏览器。
多平台通讯与直播 — 一键部署至 QQ、微信、飞书、钉钉、Telegram、Discord、Slack 等即时通讯平台,以及 Bilibili、YouTube、Twitch 等直播平台(含 360° 全景直播)。
对话与记忆 — 支持 Tavern 角色卡、多角色群聊、长期记忆、角色独立语音与头像、旁白语音。
工具与扩展生态 — 原生异步工具集(网页搜索、知识库、智能家居、沙箱代码执行、ComfyUI 图像生成、Claude Code 文件系统操作等),同时支持 MCP、Skills、A2A、HTTP 请求等自定义工具接口,内置 20+ 扩展插件(galgame、AI 编辑器、RSS 阅读器、Code Server IDE 等)。
对外提供 OpenAI 兼容格式 API、MCP 接口和桌面宠物 API,可被外部 Agent 调用。架构上采用 Electron 39 桌面壳 + Python 3.12/FastAPI 后端,AI 层通过 LangChain + LiteLLM 统一接入多 LLM 提供商(Ollama 本地 / OpenAI、Dify 云端),记忆层使用 mem0ai + FAISS + rank-bm25,语音层集成 edge-tts、sherpa-onnx、pyttsx3、elevenlabs 等多引擎。支持 Windows 10/11、macOS(M 芯片)、Linux(AppImage/deb)桌面安装及 Docker 部署,硬件门槛低(2 核 CPU / 2GB 内存即可运行,模型全部可选云端)。
部署方式
- Docker:
docker pull ailm32442/super-agent-party:latest后docker run -d -p 3456:3456 -v ./super-agent-data:/app/data ailm32442/super-agent-party:latest - Docker Compose:克隆仓库后
docker-compose up -d,默认账号 root/pass - 桌面安装:Windows 便携版/安装版、macOS DMG(M 芯片)、Linux AppImage/deb
- 源码部署:
uv sync && npm install && npm run dev(需 Python >=3.12, <3.13)
待确认项:独立官网 URL 未明确;HuggingFace 专属页面未找到;Docker Hub 镜像页未直接验证;各 IM 平台接入的实际可用性与限制未知;扩展系统插件开发规范未在收集材料中体现。