SeeAct: 通用网页智能代理系统
✨SeeAct 是一个基于大型多模态模型(如 GPT-4V)的通用网页智能代理系统,能够自主在任何网站上执行任务。它包含一个稳健的代码库和创新的框架,支持在实时网站上运行网页智能代理。
Python工作流自动化多模态
SeeAct 是一个基于大型多模态模型(如 GPT-4V)的通用网页智能代理系统,能够自主在任何网站上执行任务。它包含一个稳健的代码库和创新的框架,支持在实时网站上运行网页智能代理。
由字节跳动开发的开源多模态 AI 智能体(Agent)堆栈,包含通用智能体框架 Agent TARS 和桌面客户端 UI-TARS Desktop,通过视觉语言模型实现基于自然语言的计算机控制、浏览器自动化及 CLI 交互。
第 1 / 1 页 · 共 2 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。