发现 AI 代理的未来arrow_forward

LLMAgentPapers

calendar_today收录于 2026年2月22日
category文档教程与资源
code开源
Python大语言模型知识库多智能体系统AI代理自然语言处理文档教程与资源其他教育/研究资源

浙江大学NLP团队维护的大语言模型智能体必读论文与资源精选清单,涵盖单体智能体能力(记忆、规划、工具调用)、多智能体协作、评测基准及主流开发框架。

LLMAgentPapers 简介#

LLMAgentPapers 是由浙江大学自然语言处理组(ZJUNLP)创建并维护的 Awesome List 类型资源仓库,旨在系统性地整理和归纳 LLM Agent 领域的学术文献、框架及评测工具。

核心价值#

  • 解决信息过载:LLM Agent 领域发展极快,论文井喷,该仓库提供结构化的分类索引
  • 系统性认知:按照智能体能力和交互模式进行分类,帮助开发者快速建立知识体系
  • 工程落地参考:汇总了主流 Agent 框架和工具清单,为工程选型提供直接参考

论文分类体系#

Overview(综述)#

LLM Agent 领域调研与总体框架,如 A Survey on Large Language Model based Autonomous Agents

Agent(单体智能体)#

  • Personality(人格/角色):角色扮演与人格建模
  • Memory(记忆机制):MemoryBank、HippoRAG、Buffer of Thoughts
  • Planning(规划):ReAct、Tree of Thoughts、Reflexion、KnowAgent
  • Tool use(工具使用):WebGPT、Toolformer、ToolLLM、Gorilla
  • RL training(强化学习训练):基于强化学习的智能体训练

Multiple Agents(多智能体)#

  • Task-Oriented Communication(任务导向通信)
    • Collaborative Exchanges(协作交互)
    • Adversarial Interactions(对抗交互)
  • Casual/Open Conversations(开放对话)

典型项目:AutoGen、MetaGPT、CAMEL、AgentVerse

Application(应用场景)#

具体行业或场景应用,如社会模拟、游戏、软件开发等

资源与工具清单#

Benchmarks(评测基准)#

名称简介
AgentBench多维度 Agent 能力评测
WebArena真实网页环境下的操作评测
OSWorld操作系统级别的操作评测
TravelPlanner规划能力测试基准

框架与工具#

  • Agent with tool: AutoGPT、LangChain、Transformer Agents、WorkGPT、AutoChain、Langroid、GPT Researcher、BMTools、ToolBench、AgentGPT、xlang、Agently、Lagent、ToolEmu、Storm、Comet Opik
  • Multi-Agent: CAMEL、GPTeam、AgentVerse、MetaGPT、SocraticAI、AutoGen、Agents
  • Others: AutoAgents、GPT Engineer

如何使用#

快速访问#

直接访问 GitHub 仓库阅读 README.md,根据目录点击感兴趣的分类。

本地克隆#

git clone https://github.com/zjunlp/LLMAgentPapers.git
cd LLMAgentPapers

贡献方式#

仓库开放社区贡献,如果发现重要工作被遗漏,可按仓库指引提交 Issue 或 PR。

关联生态#

该仓库是 ZJUNLP 组织系列 Paper List 的一部分:

  • Prompt4ReasoningPapers:关注推理能力
  • KnowledgeEditingPapers:关注模型知识编辑

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch