汇总可免费使用的 LLM 推理 API 清单,涵盖 OpenRouter、Google AI Studio、Groq、Cerebras 等主流平台的速率限制、模型列表及特殊要求,适合开发者在原型阶段进行选型参考。
项目简介#
free-llm-api-resources 是一个以 Markdown 维护的资源索引仓库,为开发者提供目前市场上可用的免费或含免费额度的 LLM 推理服务清单。它不是代码库或 SDK,而是一个高密度的信息聚合器。
解决的问题#
- 信息碎片化:LLM 提供商众多,免费政策和配额分散在各家官网,该项目将其集中汇总
- 选型困难:开发者在原型阶段或个人学习时,难以快速对比各家 API 的速率限制、模型可用性及隐形成本
- 合规性筛选:明确排除逆向工程(Reverse-engineered)的不合规接口,降低使用风险
资源分类#
完全免费提供商#
- OpenRouter:20 req/min,50 req/day;充值后可达 1000 req/day;支持 Gemma 3、Llama 3.3、Mistral Small、DeepSeek-R1、Qwen 等
- Google AI Studio:Gemini 2.5 Flash、Gemma 3 系列;按模型给出 token/min 与请求限制
- NVIDIA NIM:需手机验证;40 req/min;多种开源模型
- Mistral (La Plateforme):Experiment 计划需同意数据训练;1 req/s、500k tokens/min、1B tokens/month
- Mistral (Codestral):30 req/min、2k req/day
- HuggingFace Inference:Serverless 推理,小于 10GB 模型为主;$0.10/月额度
- Cerebras:按模型列出详细的 req/min、tokens/min/h/day 限制
- Groq:按模型给出 req/day 与 tokens/min;涵盖 Llama、Whisper、Compound 等
- Cohere:20 req/min、1k req/month;Aya/Command 系列模型
- GitHub Models:按 Copilot 订阅档位不同限制;覆盖 GPT-4o/o1/o3、Llama、Mistral、DeepSeek 等
- Cloudflare Workers AI:10k neurons/day;提供大量开源模型
试用额度/积分提供商#
- Fireworks:$1 额度;多种开源模型
- Baseten:$30 额度;按计算时间付费
- Nebius:$1 额度;多种开源模型
- Novita:$0.5 额度有效期 1 年
- AI21:$10 额度 3 个月;Jamba 系列模型
- Alibaba Cloud (Intl) Model Studio:每模型 100 万 tokens;Qwen 系列与开源模型
- Modal:$5/月注册、绑定支付方式后 $30/月
- SambaNova Cloud:$5 额度 3 个月;Llama、Qwen、DeepSeek、Whisper 等
- Scaleway Generative APIs:100 万 tokens 免费
关键信息维度#
针对每个列出的提供商,项目提取了以下关键属性:
- 配额与速率限制:Req/min、Req/day、Tokens/min 等具体数值
- 模型清单:明确指出支持的免费模型名称
- 特殊限制条件:验证要求、数据政策、地域限制
适用场景#
- 开发者进行技术选型,寻找成本最低的 LLM 推理方案
- 学生或研究人员利用免费额度进行实验和论文复现
- 快速构建 MVP,在无初期投入的情况下验证想法
- 对比不同平台的推理速度与配额策略