开源AI研究助手,可连接任何LLM与内部知识源,实现团队实时协作对话,替代NotebookLM、Perplexity和Glean。
一分钟了解#
SurfSense是一个开源AI研究助手,能让您将任何大型语言模型与内部知识源连接,实现团队实时协作对话。它作为NotebookLM、Perplexity和Glean的开源替代品,支持50多种文件格式上传、知识库搜索、引用回答生成,并提供本地LLM支持和自托管选项。
核心价值:连接任何LLM到您的内部知识源,实现团队实时协作,提供引用式回答。
快速上手#
安装难度:中 - 提供多种部署方式,包括Docker一键部署和完整Docker Compose生产环境部署。
# 快速Docker部署
docker run -d -p 3000:3000 -p 8000:8000 \
-v surfsense-data:/data \
--name surfsense \
--restart unless-stopped \
ghcr.io/modsetter/surfsense:latest
适合我的场景吗?
- ✅ 知识管理团队:需要将公司内部文档、Slack消息、Jira等转化为可搜索的知识库
- ✅ 研究分析师:需要快速搜索和查询大量文档内容
- ❌ 个人简单使用:如果您只需要基本的文档摘要功能,可能过于复杂
核心能力#
1. 多格式文件上传 - 50+种文件格式支持#
支持文档、图片、视频等多种格式,将个人内容保存到个人知识库中。 实际价值:无需转换格式,直接上传任何类型的工作资料即可建立知识库
2. 知识库搜索 - 混合搜索技术#
使用语义+全文混合搜索、日期过滤和连接器特定查询功能。 实际价值:快速找到所需信息,无论内容形式如何
3. 引用式对话 - 类似Perplexity的回答#
获取带有引用来源的自然语言回答,确保信息可追溯。 实际价值:提高回答可靠性,便于验证信息来源
4. 团队协作与RBAC - 基于角色的访问控制#
为搜索空间实现基于角色的访问控制,可邀请团队成员并分配自定义角色。 实际价值:安全共享知识库,同时保持文档访问权限的细粒度控制
5. 播客生成 - 快速音频内容创建#
从对话或知识库内容生成引人入胜的音频播客。 实际价值:将研究内容转化为易于分享的音频格式
技术栈与集成#
开发语言:Python (后端), TypeScript (前端) 主要依赖:FastAPI, PostgreSQL (带pgvector), Next.js, React, LangChain, Deep Agents 集成方式:提供浏览器扩展、API集成、支持50+文件格式处理
生态与扩展#
- 插件/扩展:支持浏览器扩展,用于保存网页内容,包括受保护的认证后页面
- 集成能力:连接多种外部源,包括Google Drive、Slack、Microsoft Teams、Jira、Confluence、Notion、Gmail、YouTube、GitHub等
维护状态#
- 开发活跃度:活跃开发中,项目尚未完全生产就绪,但持续迭代
- 最近更新:频繁发布新版本,添加新功能和改进
- 社区响应:有Discord社区支持,鼓励用户参与贡献和反馈
商用与许可#
许可证:未明确说明
- ✅ 商用:开源项目,通常允许商业使用
- ✅ 修改:开源项目,通常允许修改
- ⚠️ 限制:需确认具体许可证条款
文档与学习资源#
- 文档质量:中等,提供安装指南和基本说明
- 官方文档:通过API文档可查看详细接口信息 (http://localhost:8000/docs)
- 示例代码:提供Docker部署示例和自定义配置说明