奥德赛:赋能我的世界代理的开放世界技能
✨Odyssey是一个基于大型语言模型的Minecraft智能代理框架,包含40种基础技能和183种组合技能,使AI能够在开放世界中自主探索、学习并执行多样化任务。
智能体与应用工具PythonLangChain
Odyssey是一个基于大型语言模型的Minecraft智能代理框架,包含40种基础技能和183种组合技能,使AI能够在开放世界中自主探索、学习并执行多样化任务。
一个基于强化学习的马里奥AI环境,提供可训练的智能体来玩超级马里奥游戏。
中山大学人类通信与感知实验室维护的具身智能领域论文列表,为研究人员提供最新的研究成果汇总。
微软开发的视频内容发现工具,利用深度学习技术从视频中自动识别和提取关键内容,帮助用户高效浏览和理解视频信息。
操作系统智能体(OS Agents)基于多模态大语言模型(MLLM),通过操作系统提供的图形用户界面(GUI)和命令行界面(CLI)来自动化操作电脑、手机和浏览器的任务。这个调研项目旨在整合该领域的研究现状,为学术研究和产业发展提供指导。
一个开源免费的多模态AI智能体课程,教授如何构建能够理解图像、文本、音频和视频的AI智能体系统,使用MCP协议连接各组件。
LLaVA-Plus是一个能够学习和使用工具的多模态助手系统,通过将大型语言模型与视觉技术结合,使AI代理能够执行通用视觉任务。
这是一个展示如何充分利用ChatGPT代码解释器功能的精选集合,包含各种突破限制的实验案例,让用户探索AI与代码结合的无限可能。
OSWorld是一个用于评估多模态智能体在真实计算机环境中执行开放式任务能力的基准测试平台。它支持VMware、VirtualBox、Docker和AWS等多种虚拟化环境,提供了丰富的任务场景和评估指标。
一个包含PyTorch、深度学习等多门课程的综合学习笔记资源,涵盖计算机视觉与自然语言处理领域,配有视频讲解和示例数据集。
第 1 / 1 页 · 共 10 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。