SmartCall-Agent
✨基于 LiveKit 与 OpenAI Realtime API 的模块化语音 AI 平台,集成 RAG 知识库检索、JWT 认证与 MongoDB 持久化,支持实时外呼电话与领域特定对话。
基于 LiveKit 与 OpenAI Realtime API 的模块化语音 AI 平台,集成 RAG 知识库检索、JWT 认证与 MongoDB 持久化,支持实时外呼电话与领域特定对话。
Flutter 端侧全栈 AI SDK,支持 LLM、视觉、语音、绘图与 RAG,具备计算预算合约与自适应 QoS 能力,零云依赖。
一款开源的通用多智能体框架,支持通过自然语言构建、评估和训练自主智能体舰队。具备分布式强化学习训练管道,支持网页浏览、操作系统控制等复杂环境交互,在 GAIA、OSWorld、VisualWebArena 等权威基准测试中名列前茅。
本地优先的 AI 工作空间,基于 Rust 和 Tauri 构建,作为 AI 同事对任意文件夹进行安全、监督式自动化操作。支持多 LLM 后端、MCP 协议扩展及多模态文件处理。
轻量级 LLM/Agent 应用开发框架,通过 `@llm_function` 装饰器将函数签名与 docstring 转化为 Prompt,无需函数体实现即可获得类型安全的 LLM 能力。支持多 Provider、多模态、工具调用、流式响应、API Key 负载均衡与 Langfuse 可观测性集成。
开源的全栈自主计算机智能体框架,支持在 Docker 虚拟环境中通过自然语言控制浏览器、终端和桌面应用。项目由 coasty-ai 组织维护,采用 Apache 2.0 许可证,在 OSWorld Benchmark 中获得 82% 得分。
LLM 应用的上下文优化层,通过确定性压缩与智能缓存实现 40-90% Token 节省,支持 JSON/代码/文本/图像多模态压缩及可逆 CCR 机制
跨平台 CLI 工具与浏览器扩展,支持对任意 URL(网页、YouTube、播客)或本地文件(PDF、音视频、图片)进行智能内容提取与摘要,支持多 LLM 提供商与本地模型。
无代码 LLM 平台,通过可视化 Prompt Studio 设计文档提取逻辑,一键部署为 REST API、ETL 管道或 MCP Server。支持 PDF、Word、Excel、图像等多种格式,集成 OpenAI、Anthropic、Azure 等主流 LLM,适用于金融表单处理、数据仓库 ETL 和 Agent 数据层构建。
清华大学THUNLP推出的端到端全能多模态大模型,支持视觉理解、语音对话和全双工多模态实时流交互,性能接近Gemini 2.5 Flash,可在手机端高效运行。
第 1 / 3 页 · 共 30 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。