浙江大学NLP团队维护的大语言模型智能体必读论文与资源精选清单,涵盖单体智能体能力(记忆、规划、工具调用)、多智能体协作、评测基准及主流开发框架。
LLMAgentPapers 简介#
LLMAgentPapers 是由浙江大学自然语言处理组(ZJUNLP)创建并维护的 Awesome List 类型资源仓库,旨在系统性地整理和归纳 LLM Agent 领域的学术文献、框架及评测工具。
核心价值#
- 解决信息过载:LLM Agent 领域发展极快,论文井喷,该仓库提供结构化的分类索引
- 系统性认知:按照智能体能力和交互模式进行分类,帮助开发者快速建立知识体系
- 工程落地参考:汇总了主流 Agent 框架和工具清单,为工程选型提供直接参考
论文分类体系#
Overview(综述)#
LLM Agent 领域调研与总体框架,如 A Survey on Large Language Model based Autonomous Agents
Agent(单体智能体)#
- Personality(人格/角色):角色扮演与人格建模
- Memory(记忆机制):MemoryBank、HippoRAG、Buffer of Thoughts
- Planning(规划):ReAct、Tree of Thoughts、Reflexion、KnowAgent
- Tool use(工具使用):WebGPT、Toolformer、ToolLLM、Gorilla
- RL training(强化学习训练):基于强化学习的智能体训练
Multiple Agents(多智能体)#
- Task-Oriented Communication(任务导向通信)
- Collaborative Exchanges(协作交互)
- Adversarial Interactions(对抗交互)
- Casual/Open Conversations(开放对话)
典型项目:AutoGen、MetaGPT、CAMEL、AgentVerse
Application(应用场景)#
具体行业或场景应用,如社会模拟、游戏、软件开发等
资源与工具清单#
Benchmarks(评测基准)#
| 名称 | 简介 |
|---|---|
| AgentBench | 多维度 Agent 能力评测 |
| WebArena | 真实网页环境下的操作评测 |
| OSWorld | 操作系统级别的操作评测 |
| TravelPlanner | 规划能力测试基准 |
框架与工具#
- Agent with tool: AutoGPT、LangChain、Transformer Agents、WorkGPT、AutoChain、Langroid、GPT Researcher、BMTools、ToolBench、AgentGPT、xlang、Agently、Lagent、ToolEmu、Storm、Comet Opik
- Multi-Agent: CAMEL、GPTeam、AgentVerse、MetaGPT、SocraticAI、AutoGen、Agents
- Others: AutoAgents、GPT Engineer
如何使用#
快速访问#
直接访问 GitHub 仓库阅读 README.md,根据目录点击感兴趣的分类。
本地克隆#
git clone https://github.com/zjunlp/LLMAgentPapers.git
cd LLMAgentPapers
贡献方式#
仓库开放社区贡献,如果发现重要工作被遗漏,可按仓库指引提交 Issue 或 PR。
关联生态#
该仓库是 ZJUNLP 组织系列 Paper List 的一部分:
- Prompt4ReasoningPapers:关注推理能力
- KnowledgeEditingPapers:关注模型知识编辑