发现 AI 代理的未来arrow_forward

free-llm-api-resources

calendar_today收录于 2026年2月22日
category文档教程与资源
code开源
Python大语言模型知识库SDK文档教程与资源其他开发者工具/代码模型训练/推理协议/API/集成

汇总可免费使用的 LLM 推理 API 清单,涵盖 OpenRouter、Google AI Studio、Groq、Cerebras 等主流平台的速率限制、模型列表及特殊要求,适合开发者在原型阶段进行选型参考。

项目简介#

free-llm-api-resources 是一个以 Markdown 维护的资源索引仓库,为开发者提供目前市场上可用的免费或含免费额度的 LLM 推理服务清单。它不是代码库或 SDK,而是一个高密度的信息聚合器。

解决的问题#

  • 信息碎片化:LLM 提供商众多,免费政策和配额分散在各家官网,该项目将其集中汇总
  • 选型困难:开发者在原型阶段或个人学习时,难以快速对比各家 API 的速率限制、模型可用性及隐形成本
  • 合规性筛选:明确排除逆向工程(Reverse-engineered)的不合规接口,降低使用风险

资源分类#

完全免费提供商#

  • OpenRouter:20 req/min,50 req/day;充值后可达 1000 req/day;支持 Gemma 3、Llama 3.3、Mistral Small、DeepSeek-R1、Qwen 等
  • Google AI Studio:Gemini 2.5 Flash、Gemma 3 系列;按模型给出 token/min 与请求限制
  • NVIDIA NIM:需手机验证;40 req/min;多种开源模型
  • Mistral (La Plateforme):Experiment 计划需同意数据训练;1 req/s、500k tokens/min、1B tokens/month
  • Mistral (Codestral):30 req/min、2k req/day
  • HuggingFace Inference:Serverless 推理,小于 10GB 模型为主;$0.10/月额度
  • Cerebras:按模型列出详细的 req/min、tokens/min/h/day 限制
  • Groq:按模型给出 req/day 与 tokens/min;涵盖 Llama、Whisper、Compound 等
  • Cohere:20 req/min、1k req/month;Aya/Command 系列模型
  • GitHub Models:按 Copilot 订阅档位不同限制;覆盖 GPT-4o/o1/o3、Llama、Mistral、DeepSeek 等
  • Cloudflare Workers AI:10k neurons/day;提供大量开源模型

试用额度/积分提供商#

  • Fireworks:$1 额度;多种开源模型
  • Baseten:$30 额度;按计算时间付费
  • Nebius:$1 额度;多种开源模型
  • Novita:$0.5 额度有效期 1 年
  • AI21:$10 额度 3 个月;Jamba 系列模型
  • Alibaba Cloud (Intl) Model Studio:每模型 100 万 tokens;Qwen 系列与开源模型
  • Modal:$5/月注册、绑定支付方式后 $30/月
  • SambaNova Cloud:$5 额度 3 个月;Llama、Qwen、DeepSeek、Whisper 等
  • Scaleway Generative APIs:100 万 tokens 免费

关键信息维度#

针对每个列出的提供商,项目提取了以下关键属性:

  • 配额与速率限制:Req/min、Req/day、Tokens/min 等具体数值
  • 模型清单:明确指出支持的免费模型名称
  • 特殊限制条件:验证要求、数据政策、地域限制

适用场景#

  • 开发者进行技术选型,寻找成本最低的 LLM 推理方案
  • 学生或研究人员利用免费额度进行实验和论文复现
  • 快速构建 MVP,在无初期投入的情况下验证想法
  • 对比不同平台的推理速度与配额策略

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch