发现 AI 代理的未来arrow_forward

全部项目

85 个项目

Familiar

开源、本地优先的 macOS 菜单栏应用,自动捕获屏幕上下文(截图 OCR、剪贴板镜像),让 AI 工具持续获得用户工作环境的完整记忆。

RAG多模态MCP

Clawd Cursor

AI 桌面代理——通过视觉感知与输入控制,跨应用自主完成任务的智能自动化系统。支持 5 层智能降级管道、多 AI 提供商(Anthropic/OpenAI/Ollama/Kimi),提供 Web Dashboard 与 REST API。

多模态AI代理智能体框架

SmartCall-Agent

基于 LiveKit 与 OpenAI Realtime API 的模块化语音 AI 平台,集成 RAG 知识库检索、JWT 认证与 MongoDB 持久化,支持实时外呼电话与领域特定对话。

模型与推理框架大语言模型多模态

Edge-Veda

Flutter 端侧全栈 AI SDK,支持 LLM、视觉、语音、绘图与 RAG,具备计算预算合约与自适应 QoS 能力,零云依赖。

大语言模型多模态SDK

NagaAgent

四服务协同的 AI 桌面助手框架,支持流式工具调用、GRAG 知识图谱记忆、Live2D 虚拟形象、语音交互

RAG多模态AI代理

AWorld

一款开源的通用多智能体框架,支持通过自然语言构建、评估和训练自主智能体舰队。具备分布式强化学习训练管道,支持网页浏览、操作系统控制等复杂环境交互,在 GAIA、OSWorld、VisualWebArena 等权威基准测试中名列前茅。

其他多模态大语言模型

Tandem

本地优先的 AI 工作空间,基于 Rust 和 Tauri 构建,作为 AI 同事对任意文件夹进行安全、监督式自动化操作。支持多 LLM 后端、MCP 协议扩展及多模态文件处理。

模型与推理框架大语言模型多模态

SimpleLLMFunc

轻量级 LLM/Agent 应用开发框架,通过 `@llm_function` 装饰器将函数签名与 docstring 转化为 Prompt,无需函数体实现即可获得类型安全的 LLM 能力。支持多 Provider、多模态、工具调用、流式响应、API Key 负载均衡与 Langfuse 可观测性集成。

模型与推理框架大语言模型多模态

Open Computer Use

开源的全栈自主计算机智能体框架,支持在 Docker 虚拟环境中通过自然语言控制浏览器、终端和桌面应用。项目由 coasty-ai 组织维护,采用 Apache 2.0 许可证,在 OSWorld Benchmark 中获得 82% 得分。

模型与推理框架自然语言处理多模态

Headroom

LLM 应用的上下文优化层,通过确定性压缩与智能缓存实现 40-90% Token 节省,支持 JSON/代码/文本/图像多模态压缩及可逆 CCR 机制

模型与推理框架SDK大语言模型
每页
...

第 1 / 9 页 · 共 85 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch