汇总大模型长思维链(Long-CoT)推理领域的精选资源,包括前沿论文、开源代码实现及训练数据集,追踪Long-CoT技术的最新进展与应用范式。
Awesome Long Chain-of-Thought Reasoning#
项目概述#
这是一个专注于 Long Chain-of-Thought (Long-CoT) Reasoning 的精选资源列表(Awesome List)。随着 OpenAI o1、DeepSeek-R1 等模型的发布,"长思维链"——即在回答前进行深度、多步内部推理——已成为提升大语言模型逻辑能力的关键技术方向。
本项目旨在系统化整理当前 AI 领域关于 Long-CoT 的研究成果,解决该领域研究爆发式增长带来的信息碎片化问题。
核心价值#
- 学术研究入口:快速检索 Long-CoT 领域的 SOTA 论文和理论基础
- 开发实践参考:提供开源推理链数据集和强化学习微调代码的索引
- 技术趋势追踪:了解当前主流的长推理模型架构与范式演进
资源类型#
| 类别 | 说明 |
|---|---|
| 论文集合 | ArXiv 上 Long-CoT 相关的学术论文索引 |
| 开源实现 | GitHub 上相关复现仓库(如 DeepSeek-R1, Open-O1 等) |
| 数据集 | 用于训练长推理能力的数据资源 |
| 方法论 | 思维树、自我修正、强化学习微调等子方向分类 |
适用场景#
- 大模型推理能力研究
- Prompt Engineering 与 System 2 Thinking 探索
- RLHF/RLAIF 相关的强化学习应用
- 多模态长推理任务
快速使用#
# 克隆到本地浏览
git clone https://github.com/LightChen233/Awesome-Long-Chain-of-Thought-Reasoning.git
或直接访问 GitHub 仓库页面,在 README 中浏览分类目录并跳转至感兴趣的资源链接。