发现 AI 代理的未来arrow_forward

InternTA

calendar_today收录于 2026年4月22日
category智能体与应用工具
code开源
Python工作流自动化DockerPyTorch大语言模型多智能体系统TransformersRAGAI代理智能体框架智能体与应用工具模型与推理框架知识管理/检索/RAG教育/研究资源模型训练/推理

基于多 Agent 协作的自动化 AI 教学助理训练系统,从课程教材出发,通过数据构建、QLoRA 微调、RAG 增强全流水线生成课程专属 TA 模型,支持完全本地部署。

InternTA 是一个面向教学材料稀缺课程场景的多 Agent 自动化 AI 教学助理训练系统,当前在合成生物学教育领域完成验证。系统由三个核心 Agent 协作运行:

Dataset Agent:从 Excel 教材中提取习题、术语和概念,生成带显式推理路径的 OpenAI conversation 格式训练数据,对思考题采用引导式回答策略(而非直接给出答案),输出 training.json / validation.json

Training Agent:以 DeepSeek-R1-Distill-Qwen-7B 为基础模型,通过 PEFT + QLoRA(4-bit 量化)进行高效微调,内置 LLM Judge 实现自动化训练计划生成与调参,支持基础 SFT(train.sh)和高级 Agent 驱动训练(traino.sh)两种模式。

RAG Agent:在推理阶段对教材内容进行结构化处理与语义检索,将相关知识片段融入生成过程,弥补微调后模型在细粒度知识点上的不足。

端到端数据流#

Excel 原始数据 → data/generate_data.py → training.json / validation.json
                                    ↓
                    train_agent.py 或 sft_internTA2.py (QLoRA 微调)
                                    ↓
                            merge.py (合并 LoRA 适配器)
                                    ↓
                    api.py (FastAPI) + app.py (Streamlit) → 用户访问

部署与集成#

  • 全本地部署,8GB+ VRAM GPU 即可运行,避免数据外泄
  • 提供 OpenAI 兼容的 /v1/chat/completions 端点,Bearer Token 认证
  • Streamlit Web 界面(默认端口 8080)+ FastAPI API 服务双入口
  • 存在 Dockerfile.webdocker-compose.web.yml,具体使用说明待确认

快速启动#

git clone https://github.com/kongfoo-ai/internTA
cd internTA
pip install -r requirements.txt
sh run.sh

待确认信息#

  • 关联论文:README 未直接引用,可能存在但未标注
  • 在线体验地址:提及 "E. Copi (Education)" 但未提供具体 URL
  • 模型权重/Checkpoint:仓库中未发布
  • 量化评估结果:提及效果良好但未公开具体数值
  • RAG 实现细节:向量数据库/嵌入模型未明确说明
  • LLM Judge 具体实现:评判标准和依赖模型未详细说明

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch