LEANN 是一款专为个人设备设计的创新向量数据库,通过基于图的选择性重计算技术,在保持零精度损失的前提下,将存储空间减少 97%。它支持在本地笔记本上对文件系统、邮件、聊天记录、代码库及实时数据进行快速、准确且 100% 私密的 RAG(检索增强生成)操作。
一分钟了解#
LEANN 是一个能让你在个人笔记本上运行"万物皆可 RAG"的轻量级向量数据库。它通过独特的图结构优化技术,解决了传统向量数据库占用存储空间过大的痛点。
核心价值:将 6000 万条文档的索引从 201GB 压缩至 6GB,且不损失任何搜索精度,让真正的个人私有 AI 成为可能。
快速上手#
安装难度:中 - 需要配置 Python 环境及部分系统依赖(如 Boost, Protobuf)。
# 1. 安装包管理器 uv
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. 克隆仓库
git clone https://github.com/yichuan-w/LEANN.git leann
cd leann
# 3. 安装 LEANN
uv venv
source .venv/bin/activate
uv pip install leann
适合我的场景吗?
- ✅ 隐私敏感用户:需要完全离线、数据不出本地的 RAG 方案。
- ✅ 个人知识管理:想在海量邮件、聊天记录、PDF 中进行语义搜索。
- ✅ 本地开发者:希望在 Claude Code 中对代码库进行语义检索。
- ❌ 企业级分布式搜索:目前主要针对单机场景,非分布式数据库。
核心能力#
1. 97% 存储节省 - 极致压缩#
- 利用图算法在搜索时实时计算部分向量,而非预先存储所有数据。 实际价值:原本需要 200GB 硬盘的索引现在只需 6GB,轻松装进笔记本电脑。
2. 全源数据接入 - 万物皆可 RAG#
- 支持文档 (PDF/TXT/MD)、Apple Mail、浏览器历史、微信/iMessage/ChatGPT 聊天记录、代码库以及通过 MCP 协议接入的 Slack/Twitter 等实时数据。 实际价值:一个工具打通个人数字生活的所有信息孤岛。
3. 开发者友好 - 代码语义搜索#
- 作为 MCP 服务直接集成进 Claude Code,支持 AST 感知的代码分块,提供比关键词 grep 更智能的代码理解。 实际价值:无需切换工作流,直接在 IDE 中获得基于语义的代码检索和补全。