发现 AI 代理的未来arrow_forward

全部项目

25 个项目

Clawd Cursor

AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。

多模态AI代理智能体框架

Edge-Veda

Flutter 端侧全栈 AI SDK,支持 LLM、视觉、语音、绘图与 RAG,具备计算预算合约与自适应 QoS 能力,零云依赖。

大语言模型多模态SDK

Seline

一款本地优先的 AI 桌面应用,集成了对话 AI、视觉生成、向量检索与多渠道消息连接,支持深度研究模式与本地知识库。

多模态MCPRAG

CogAgent

由清华大学与智谱 AI 联合推出的开源端到端视觉语言模型驱动的 GUI 智能体,基于 GLM-4V-9B 双语开源 VLM 基座模型,通过屏幕截图与自然语言指令实现跨平台(Windows/macOS/Android)图形界面自动化操作与推理。

模型与推理框架大语言模型多模态

MobileAgent

MobileAgent 是一个基于多模态大语言模型(MLLM)的自主移动端智能体框架,通过视觉感知与工具调用实现手机应用的自动化操作与任务执行,支持 Android 真机与模拟器环境。

模型与推理框架大语言模型多模态

Blades - Go语言多模态AI智能体框架

Blades是Go语言的多模态AI Agent框架,支持自定义模型、工具、记忆和中间件,适用于多轮对话、思维链推理和结构化输出等场景。

智能体与应用工具Go智能体框架

FilmAgent:多智能体电影自动化框架

FilmAgent是一个在虚拟3D空间中进行端到端电影自动化的多智能体协作系统,模拟电影制作团队中的关键角色,如导演、编剧、演员和摄影师,通过沙盒环境实现高效工作流程。

智能体与应用工具PythonC#

Overeasy

一个用于编排零样本计算机视觉模型的Python库,无需收集和标记大型训练数据即可构建自定义端到端视觉解决方案。

模型与推理框架Python多模态

Open-AutoGLM

开源的手机端智能助理框架,通过多模态理解手机屏幕内容并执行自动化操作,帮助用户完成任务。

智能体与应用工具Python智能体框架

JarvisArt:智能修图助手

JarvisArt是一个多模态大语言模型驱动的智能修图代理,通过理解用户意图、模拟专业艺术家推理,协调Adobe Lightroom中的200多种工具来解放人类艺术创造力。

智能体与应用工具PythonAI代理
每页

第 1 / 3 页 · 共 25 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch