Clawd Cursor
✨AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。
AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。
四服务协同的 AI 桌面助手框架,支持流式工具调用、GRAG 知识图谱记忆、Live2D 虚拟形象、语音交互
一款本地优先的 AI 桌面应用,集成了对话 AI、视觉生成、向量检索与多渠道消息连接,支持深度研究模式与本地知识库。
由清华大学与智谱 AI 联合推出的开源端到端视觉语言模型驱动的 GUI 智能体,基于 GLM-4V-9B 双语开源 VLM 基座模型,通过屏幕截图与自然语言指令实现跨平台(Windows/macOS/Android)图形界面自动化操作与推理。
MobileAgent 是一个基于多模态大语言模型(MLLM)的自主移动端智能体框架,通过视觉感知与工具调用实现手机应用的自动化操作与任务执行,支持 Android 真机与模拟器环境。
基于 LiveKit 构建的可学习、可配置、高度插件化的全能型实时交互虚拟助手框架,支持多模态记忆、用户画像与外部工具集成。
Stream公司开发的开源视觉智能体框架,支持任何模型或视频提供商,通过Stream的边缘网络实现超低延迟,帮助开发者快速构建视觉AI应用。
Rodel Agent是一款Windows桌面应用程序,整合聊天、文本转语音、图像生成和翻译功能。支持主流AI服务和MCP服务器插件,采用AOT编译,为用户提供优秀的桌面AI体验。
Odyssey是一个基于大型语言模型的Minecraft智能代理框架,包含40种基础技能和183种组合技能,使AI能够在开放世界中自主探索、学习并执行多样化任务。
一个可自定义的AI桌面伴侣项目,支持角色设定、语音对话、长期记忆等功能,响应时间低于1秒,可集成Live2D模型。
第 1 / 5 页 · 共 41 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。