Agent Park - Agent 项目导航

发现 AI 代理的未来arrow_forward

smart_toyAgent Park

中文 / EN 提交项目

全部项目

18 个项目

Edge-Veda

✨

Flutter 端侧全栈 AI SDK，支持 LLM、视觉、语音、绘图与 RAG，具备计算预算合约与自适应 QoS 能力，零云依赖。

大语言模型多模态SDK

查看详情 →

trackers

✨

即插即用的多目标跟踪（MOT）Python库，提供SORT和ByteTrack等经典算法的模块化实现。采用检测器无关设计，可配合任意目标检测模型（YOLO、DETR等）使用，支持视频文件、摄像头、RTSP流等多种输入源。提供统一CLI工具与Python API，内置CLEAR、HOTA、Identity等标准MOT评估指标计算功能。

多模态深度学习SDK

查看详情 →

MiniCPM-o

✨

清华大学THUNLP推出的端到端全能多模态大模型，支持视觉理解、语音对话和全双工多模态实时流交互，性能接近Gemini 2.5 Flash，可在手机端高效运行。

大语言模型多模态Transformers

查看详情 →

Vision-Agents 视觉智能体

✨

Stream公司开发的开源视觉智能体框架，支持任何模型或视频提供商，通过Stream的边缘网络实现超低延迟，帮助开发者快速构建视觉AI应用。

智能体与应用工具PythonPyTorch

查看详情 →

My-Neuro: AI个人助手

✨

一个可自定义的AI桌面伴侣项目，支持角色设定、语音对话、长期记忆等功能，响应时间低于1秒，可集成Live2D模型。

智能体与应用工具PythonElectron

查看详情 →

Blades - Go语言多模态AI智能体框架

✨

Blades是Go语言的多模态AI Agent框架，支持自定义模型、工具、记忆和中间件，适用于多轮对话、思维链推理和结构化输出等场景。

智能体与应用工具Go智能体框架

查看详情 →

Overeasy

✨

一个用于编排零样本计算机视觉模型的Python库，无需收集和标记大型训练数据即可构建自定义端到端视觉解决方案。

模型与推理框架Python多模态

查看详情 →

hCaptcha 验证码挑战者

✨

一个使用多模态大语言模型优雅解决 hCaptcha 验证码挑战的项目，不依赖用户脚本或第三方验证码服务。

智能体与应用工具Python多模态

查看详情 →

马里奥AI

✨

一个基于强化学习的马里奥AI环境，提供可训练的智能体来玩超级马里奥游戏。

智能体与应用工具PythonPyTorch

查看详情 →

DeepVideoDiscovery

✨

微软开发的视频内容发现工具，利用深度学习技术从视频中自动识别和提取关键内容，帮助用户高效浏览和理解视频信息。

智能体与应用工具PythonPyTorch

查看详情 →

每页

第 1 / 2 页 · 共 18 条

保持更新

获取最新的 AI 工具和趋势，直接发送到您的收件箱。没有垃圾邮件，只有智能。

rocket_launch