ReCall：基于强化学习的大语言模型工具调用推理框架

ReCall是一个创新的强化学习框架，用于训练大语言模型通过工具调用进行推理，无需监督数据即可提升模型的问题解决能力。

一分钟了解#

ReCall是一个基于强化学习的框架，专门用于训练大语言模型通过智能工具调用进行推理。它让LLMs能够像智能体一样主动使用和组合各种工具，如OpenAI o3等，为通用人工智能代理提供了可行的实现路径。ReCall是ReSearch的升级版，扩展了单一搜索工具的支持，可推理任意用户定义的工具。

核心价值：无需监督数据即可通过强化学习提升大语言模型的工具推理能力

快速上手#

安装难度：高 - 需要Python 3.10、GPU资源以及多个复杂依赖项的安装

conda create -n re-call python==3.10
conda activate re-call
git clone https://github.com/Agent-RL/ReCall.git
cd ReCall
pip3 install -e .
pip3 install flash-attn --no-build-isolation
conda install -c pytorch -c nvidia faiss-gpu=1.8.0

适合我的场景吗？

✅ 大语言模型推理能力增强：需要LLM主动使用工具解决复杂问题

✅ 多跳问答系统：如需要处理需要多次检索和推理的问题

✅ 强化学习研究者：需要对LLM进行工具使用能力训练

❌ 资源有限环境：需要多GPU和大量计算资源

❌ 需要即插即用：项目需要配置多个服务组件

核心能力#

1. 工具调用推理 - 无需监督数据#

通过强化学习让大语言模型学会自主调用和组合工具，无需预定义工具使用轨迹或推理步骤的监督数据 实际价值：降低模型训练成本，提升解决复杂问题的能力

2. 多跳问答处理#

通过Wikipedia检索和推理工具组合，处理需要多次信息检索和推理的复杂问题 实际价值：提升问答系统的准确性和复杂问题处理能力

3. 沙盒安全执行环境#

提供Python代码执行的沙盒环境，确保工具调用的安全性 实际价值：在安全的环境下执行不可信代码，保护系统安全

4. 合成数据生成#

生成多样化环境和复杂多步任务的合成数据，帮助模型发展复杂的工具推理能力 实际价值：扩展模型训练数据，提升泛化能力

技术栈与集成#

开发语言：Python 主要依赖：verl (0.3.0)、vllm (0.8.4)、SGLang、FastAPI、FlashRAG 集成方式：SDK / Library

维护状态#

开发活跃度：高 - 项目于2025年4月24日发布首个版本，近期有持续更新
最近更新：近期发布了训练模型和完整实现
社区响应：活跃 - 有多个配套工具和服务的实现

文档与学习资源#

文档质量：全面 - 包含安装、快速开始、训练、推理和评估等完整文档
官方文档：README.md (包含在GitHub仓库中)
示例代码：提供训练脚本、推理示例和评估代码

ReCall：基于强化学习的大语言模型工具调用推理框架

一分钟了解#

快速上手#

核心能力#

1. 工具调用推理 - 无需监督数据#

2. 多跳问答处理#

3. 沙盒安全执行环境#

4. 合成数据生成#

技术栈与集成#

维护状态#

文档与学习资源#

相关项目

oh-my-codex

Ironcurtain

vibe-remote

保持更新