ST-WebAgentBench
✨面向企业场景的 Web 代理安全性与可信度基准测试套件,包含 375 个任务覆盖 GitLab、SuiteCRM、ShoppingAdmin 三大应用,基于六大策略维度评估代理在合规约束下的任务完成能力。已被 ICLR 2025 接收。
模型与推理框架大语言模型AI代理
面向企业场景的 Web 代理安全性与可信度基准测试套件,包含 375 个任务覆盖 GitLab、SuiteCRM、ShoppingAdmin 三大应用,基于六大策略维度评估代理在合规约束下的任务完成能力。已被 ICLR 2025 接收。
一个用于大规模培训、雇佣和管理自动化代理的平台,专注于浏览器自动化,提供比OpenAI Operator更可靠且本地化的解决方案。
Hercules是全球首个开源测试代理,无需编写代码或维护即可实现UI、API、安全、无障碍和视觉验证,让测试自动化变得简单高效。
一个开源的 Chromium 分支,在浏览器中本地运行 AI 智能代理,提供隐私优先的浏览体验,替代 ChatGPT Atlas、Perplexity Comet 和 Dia 等服务。
第 1 / 1 页 · 共 4 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。