发现 AI 代理的未来arrow_forward

ReCall:基于强化学习的大语言模型工具调用推理框架

calendar_today收录于 2026年1月24日
category模型与推理框架
code开源
Python工作流自动化PyTorch大语言模型TransformersAI代理强化学习智能体框架vLLM模型与推理框架开发者工具/代码模型训练/推理

ReCall是一个创新的强化学习框架,用于训练大语言模型通过工具调用进行推理,无需监督数据即可提升模型的问题解决能力。

一分钟了解#

ReCall是一个基于强化学习的框架,专门用于训练大语言模型通过智能工具调用进行推理。它让LLMs能够像智能体一样主动使用和组合各种工具,如OpenAI o3等,为通用人工智能代理提供了可行的实现路径。ReCall是ReSearch的升级版,扩展了单一搜索工具的支持,可推理任意用户定义的工具。

核心价值:无需监督数据即可通过强化学习提升大语言模型的工具推理能力

快速上手#

安装难度:高 - 需要Python 3.10、GPU资源以及多个复杂依赖项的安装

conda create -n re-call python==3.10
conda activate re-call
git clone https://github.com/Agent-RL/ReCall.git
cd ReCall
pip3 install -e .
pip3 install flash-attn --no-build-isolation
conda install -c pytorch -c nvidia faiss-gpu=1.8.0

适合我的场景吗?

  • ✅ 大语言模型推理能力增强:需要LLM主动使用工具解决复杂问题
  • ✅ 多跳问答系统:如需要处理需要多次检索和推理的问题
  • ✅ 强化学习研究者:需要对LLM进行工具使用能力训练
  • ❌ 资源有限环境:需要多GPU和大量计算资源
  • ❌ 需要即插即用:项目需要配置多个服务组件

核心能力#

1. 工具调用推理 - 无需监督数据#

  • 通过强化学习让大语言模型学会自主调用和组合工具,无需预定义工具使用轨迹或推理步骤的监督数据 实际价值:降低模型训练成本,提升解决复杂问题的能力

2. 多跳问答处理#

  • 通过Wikipedia检索和推理工具组合,处理需要多次信息检索和推理的复杂问题 实际价值:提升问答系统的准确性和复杂问题处理能力

3. 沙盒安全执行环境#

  • 提供Python代码执行的沙盒环境,确保工具调用的安全性 实际价值:在安全的环境下执行不可信代码,保护系统安全

4. 合成数据生成#

  • 生成多样化环境和复杂多步任务的合成数据,帮助模型发展复杂的工具推理能力 实际价值:扩展模型训练数据,提升泛化能力

技术栈与集成#

开发语言:Python 主要依赖:verl (0.3.0)、vllm (0.8.4)、SGLang、FastAPI、FlashRAG 集成方式:SDK / Library

维护状态#

  • 开发活跃度:高 - 项目于2025年4月24日发布首个版本,近期有持续更新
  • 最近更新:近期发布了训练模型和完整实现
  • 社区响应:活跃 - 有多个配套工具和服务的实现

文档与学习资源#

  • 文档质量:全面 - 包含安装、快速开始、训练、推理和评估等完整文档
  • 官方文档:README.md (包含在GitHub仓库中)
  • 示例代码:提供训练脚本、推理示例和评估代码

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch