free-llm-api-resources

汇总可免费使用的 LLM 推理 API 清单，涵盖 OpenRouter、Google AI Studio、Groq、Cerebras 等主流平台的速率限制、模型列表及特殊要求，适合开发者在原型阶段进行选型参考。

项目简介#

free-llm-api-resources 是一个以 Markdown 维护的资源索引仓库，为开发者提供目前市场上可用的免费或含免费额度的 LLM 推理服务清单。它不是代码库或 SDK，而是一个高密度的信息聚合器。

OpenRouter：20 req/min，50 req/day；充值后可达 1000 req/day；支持 Gemma 3、Llama 3.3、Mistral Small、DeepSeek-R1、Qwen 等
Google AI Studio：Gemini 2.5 Flash、Gemma 3 系列；按模型给出 token/min 与请求限制
NVIDIA NIM：需手机验证；40 req/min；多种开源模型
Mistral (La Plateforme)：Experiment 计划需同意数据训练；1 req/s、500k tokens/min、1B tokens/month
Mistral (Codestral)：30 req/min、2k req/day
HuggingFace Inference：Serverless 推理，小于 10GB 模型为主；$0.10/月额度
Cerebras：按模型列出详细的 req/min、tokens/min/h/day 限制
Groq：按模型给出 req/day 与 tokens/min；涵盖 Llama、Whisper、Compound 等
Cohere：20 req/min、1k req/month；Aya/Command 系列模型
GitHub Models：按 Copilot 订阅档位不同限制；覆盖 GPT-4o/o1/o3、Llama、Mistral、DeepSeek 等
Cloudflare Workers AI：10k neurons/day；提供大量开源模型