受生物认知启发的下一代 AI 智能记忆系统,集成 Neo4j 图存储、Lucene+BERT 混合检索与动态遗忘机制,检索准确率达 92%,解决大模型长期记忆缺失与多智能体协作记忆缺口问题。
项目概述#
MemoryBear 是由 RedBear AI (SuanmoSuanyangTechnology) 团队开发的开源智能记忆管理系统,旨在突破大语言模型固有的「知识遗忘」限制,赋予 AI 类人的记忆能力。
开源协议: Apache License 2.0
当前版本: v0.2.4 (Intelligent Resilience)
核心能力#
记忆提取引擎#
- 多维度结构化提炼,提取结构化三元组作为认知基础
- 时间信息锚定,自动提取时间戳并关联内容
- 智能修剪摘要,支持自定义长度(50-500字)
图存储层#
- 基于 Neo4j 的可视化知识网络
- 支持数百万实体和数千万关系边
- 覆盖 12 种核心关系类型(层次、因果、时间、逻辑等)
- 交互式图可视化能力
混合检索#
- 关键词搜索(Lucene 优化)+ 语义向量搜索(BERT 嵌入)
- 毫秒级精确匹配与深度语义比较
- 识别同义词、近义词和隐含意图
- 检索准确率达到 92%,相比单一模式提升 35%
记忆遗忘引擎#
- 基于记忆强度和时间衰减的动态衰减
- 三阶段生命周期:休眠 → 衰减 → 清除
- 冗余知识保持在 8% 以下,减少浪费超过 60%
自我反思引擎#
- 每日午夜自动运行
- 一致性检查、价值评估、关联优化
FastAPI 服务#
- 统一服务架构,高性能易集成
- 支持 JSON/XML 格式,平均延迟低于 50ms
- 单实例支持 1000 QPS 并发
- 自动生成 Swagger API 文档
解决的核心问题#
- 单模型知识遗忘: 上下文窗口限制(8k-32k tokens)、静态知识库与动态数据的差距
- 多智能体协作记忆缺口: 智能体间数据孤岛、对话状态不一致、决策冲突
- 模型推理中的语义歧义: 个性化信号编码不准确、跨语言记忆链接断裂
性能基准#
- 向量版准确率: 72.90 ± 0.19%
- 图版准确率: 75.00 ± 0.20%
- 混合检索准确率: 92%
- 在单跳、多跳推理、开放泛化、时间推理任务中达到 SOTA 水平
应用场景#
- 客户服务系统(咨询、售后、推荐智能体)
- 企业知识管理(CRM、OA、研发管理)
- 个性化对话系统
- 多智能体协作系统
环境要求#
- Node.js 20.19+ 或 22.12+
- Python 3.12
- PostgreSQL 13+
- Neo4j 4.4+
- Redis 6.0+
快速开始#
# 克隆项目
git clone https://github.com/SuanmoSuanyangTechnology/MemoryBear.git
# 后端设置
cd api
pip install uv
uv sync
cp env.example .env # 配置环境变量
alembic upgrade head
uv run -m app.main
# 前端设置(新终端)
cd web
npm install
npm run dev
# 初始化数据库
curl -X POST http://127.0.0.1:8000/api/setup
核心配置#
# Neo4j
NEO4J_URI=bolt://localhost:7687
NEO4J_USERNAME=neo4j
NEO4J_PASSWORD=your-password
# PostgreSQL
DB_HOST=127.0.0.1
DB_PORT=5432
DB_USER=postgres
DB_PASSWORD=your-password
DB_NAME=redbear-mem
# Redis
REDIS_HOST=127.0.0.1
REDIS_PORT=6379
BROKER_URL=redis://127.0.0.1:6379/0
主要语言构成#
Python (72.9%), TypeScript (24.5%), Jinja (1.9%), CSS (0.3%), JavaScript (0.2%), Rust (0.1%)
待确认信息#
- Hugging Face 页面尚未发现官方模型或数据集
- 论文《Memory Bear AI: A Breakthrough from Memory to Cognition》完整内容需 JavaScript 访问
- 与 Mem O、Zep、LangMem 等系统的具体对比数据待补充
- 生产环境部署案例待提供