Vision-Agents 视觉智能体
✨Stream公司开发的开源视觉智能体框架,支持任何模型或视频提供商,通过Stream的边缘网络实现超低延迟,帮助开发者快速构建视觉AI应用。
智能体与应用工具PythonPyTorch
Stream公司开发的开源视觉智能体框架,支持任何模型或视频提供商,通过Stream的边缘网络实现超低延迟,帮助开发者快速构建视觉AI应用。
一个使用多模态大语言模型优雅解决 hCaptcha 验证码挑战的项目,不依赖用户脚本或第三方验证码服务。
在终端中运行的AI助手,具有本地工具功能:编写代码、使用终端、浏览网页、视觉识别等能力,是ChatGPT和Cursor的本地替代品。
由字节跳动开发的开源多模态 AI 智能体(Agent)堆栈,包含通用智能体框架 Agent TARS 和桌面客户端 UI-TARS Desktop,通过视觉语言模型实现基于自然语言的计算机控制、浏览器自动化及 CLI 交互。
第 1 / 1 页 · 共 4 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。