面向智能代理和聊天机器人的生产就绪型记忆系统,提供三层记忆层级、语义搜索和自动优化,支持 REST API、MCP 协议和 CLI。
Cortex Memory 是一个为智能代理和聊天机器人设计的生产就绪型记忆系统,采用 Rust 开发(86.9%),提供从记忆提取、语义搜索到自动优化的完整解决方案。
核心架构#
- 三层记忆层级:L0 Abstract → L1 Overview → L2 Detail,渐进式上下文披露,优化 LLM Token 消耗
- 虚拟文件系统:
cortex://URI 方案组织数据,支持 session/user/agent/resources 四维度命名空间 - 混合存储:文件系统(Markdown 持久化)+ Qdrant 向量数据库(语义索引)
核心能力#
- LLM 驱动的智能内存提取(自动提取事实、决策、实体)
- 基于 Qdrant 的高性能向量语义搜索,支持元数据过滤和加权评分
- 多租户隔离支持,通过租户感知的集合命名实现
- 事件驱动自动化(文件监视器、自动索引器)
- Web 仪表板(Svelte 5 SPA)用于监控、租户管理和语义搜索可视化
访问方式#
- REST API(基于 Axum,/api/v2/* 端点)
- CLI 命令行工具
- MCP 协议服务器(暴露 store_memory、query_memory 等工具)
- 原生 Rust 库
性能表现#
基于 LOCOMO 数据集评估(50 对话,150 问题):
- Recall@1: 93.33%(相比 LangMem +67.02pp)
- Recall@3: 94.00%(相比 LangMem +44.00pp)
- MRR: 93.72%(相比 LangMem +54.90pp)
- NDCG@5: 80.73%(相比 LangMem +62.01pp)
前置依赖#
- Rust 1.86+
- Qdrant 1.7+(向量数据库)
- OpenAI 兼容的 LLM API 端点
- OpenAI 兼容的 Embedding API 端点
安装方式#
cargo install --path cortex-mem-cli # CLI 工具
cargo install --path cortex-mem-service # REST API 服务
cargo install --path cortex-mem-mcp # MCP 服务器
模块组成#
| 模块 | 职责 |
|---|---|
| cortex-mem-core | 核心层:文件系统抽象、LLM 客户端、Qdrant 集成、层级生成 |
| cortex-mem-service | REST API 服务器 |
| cortex-mem-cli | 命令行工具 |
| cortex-mem-insights | Svelte 5 SPA 仪表板 |
| cortex-mem-mcp | MCP 协议服务器 |
| cortex-mem-rig | Rig 框架集成层 |
适用场景#
- 构建 LLM 驱动的聊天机器人和智能代理
- 创建个性化 AI 助手(记住用户偏好和历史)
- 需要记忆骨干的开源 AI 项目
- 跨多次对话保持上下文的智能应用