一个具备仿生架构的智能体记忆系统,通过反思机制让 AI 从经验中持续学习,支持多策略检索,在 LongMemEval 基准测试中表现优异,采用 MIT 开源协议。
核心理念#
Hindsight 是一个专注于让智能体通过反思机制从经验中"学习"而非单纯回忆历史的记忆系统。传统 Agent 记忆系统大多侧重于对话历史的存储与检索(RAG),导致 Agent 只能"回忆"而不能"成长"。Hindsight 通过仿生架构解决这一问题。
仿生记忆架构#
记忆被组织为三个层级,模拟人类认知结构:
- World(世界知识):存储客观事实(如 "Alice works at Google"),类似陈述性记忆
- Experiences(经历):记录 Agent 自身的交互过程和事件流,类似情景记忆
- Mental Models(心智模型):通过 reflect 操作从 Experiences 和 World 中提炼的抽象理解,是实现"学习"的关键
核心操作#
- Retain(保留):将非结构化内容摄入并分类存储到指定的 Bank 中
- Recall(回忆):利用多策略检索引擎,根据 Query 激活相关记忆
- Reflect(反思):触发推理机制,分析现有记忆,生成新的洞察或更新 Mental Models
多策略检索#
系统内置复合检索逻辑,结合:
- 语义相似性检索
- 精确关键词匹配
- 实体关系图查询
- 时间维度检索
快速上手#
from hindsight_client import Hindsight
client = Hindsight(base_url="http://localhost:8888")
# 存储信息
client.retain(bank_id="my-bank", content="Alice works at Google")
# 检索记忆
results = client.recall(bank_id="my-bank", query="What does Alice do?")
# 生成洞察
client.reflect(bank_id="my-bank", query="Tell me about Alice")
适用场景#
- 长期运行的 AI 员工(需积累行业知识或公司流程)
- 自适应交互(根据用户反馈调整行为)
- 复杂任务自动化(长周期内维持状态和经验)
- 千人千面个性化(记忆特定用户偏好)
性能表现#
在 LongMemEval 基准测试中达到 SOTA 水平。
开发资源#
- GitHub Stars: 1.5k+
- 许可协议: MIT License
- SDK 支持: Python、Node.js/TypeScript
⚠️ 注意:输入材料未提供具体的 GitHub 仓库地址和官方文档链接,需进一步搜索确认。部署方式(Docker/二进制/Library)及底层存储依赖(向量数据库)待核实。