AWorld
✨一款开源的通用多智能体框架,支持通过自然语言构建、评估和训练自主智能体舰队。具备分布式强化学习训练管道,支持网页浏览、操作系统控制等复杂环境交互,在 GAIA、OSWorld、VisualWebArena 等权威基准测试中名列前茅。
一款开源的通用多智能体框架,支持通过自然语言构建、评估和训练自主智能体舰队。具备分布式强化学习训练管道,支持网页浏览、操作系统控制等复杂环境交互,在 GAIA、OSWorld、VisualWebArena 等权威基准测试中名列前茅。
受人类认知双过程理论启发的生成式智能体框架,结合快思考与慢思考机制,通过上下文强化学习高效解决复杂交互式推理任务。
清华大学 THUDM 推出的 LLM 强化学习后训练框架,深度融合 Megatron-LM 训练能力与 SGLang 推理引擎,支持大规模 RL Scaling,适用于 GLM、Qwen、DeepSeek、Llama 等大模型的分布式强化学习训练。
AI-Compass是为社区提供AI技术学习路径与实践指南的综合性开源项目,从基础理论到前沿应用,帮助初学者到专业开发者构建完整的AI知识体系。
一个每日更新的自主智能体(大语言模型)研究论文集合,为研究人员和开发者提供最新的AI领域研究成果。
Odyssey是一个基于大型语言模型的Minecraft智能代理框架,包含40种基础技能和183种组合技能,使AI能够在开放世界中自主探索、学习并执行多样化任务。
一个专注于自主智能体研究的论文集合,涵盖基于强化学习和基于大型语言模型两大研究方向,帮助研究者快速了解领域前沿。
Trinity-RFT是一个通用、灵活且用户友好的LLM强化微调(RFT)框架,通过将RFT解耦为三个协同工作的组件:Explorer、Trainer和Buffer,为不同背景的用户提供针对特定领域的训练能力。
一个精选的结合大语言模型的具身AI或机器人研究列表,追踪该领域的最新研究成果和进展。
一个总结使用强化训练开源大语言模型智能体的awesome列表,包含基础框架、通用/多任务、搜索/研究/网页、GUI和工具等类别的开源项目。
第 1 / 2 页 · 共 14 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。