上海交通大学 GENTEL-lab 开发的自进化虚拟疾病生物学家,基于多智能体系统和 MCP 协议,集成 600+ 生物信息学工具,用于自动化的治疗靶点发现与分子机制分析。
项目简介#
OriGene 是由上海交通大学 GENTEL-lab 开发的自进化虚拟疾病生物学家系统,于 2025 年世界人工智能大会(WAIC)正式发布。该系统旨在解决药物研发中靶点发现过程高度依赖人工直觉、数据碎片化及分析周期长的痛点。
核心能力#
智能靶点发现:自动化整合 ChEMBL、PubChem、OpenTargets、NCBI、TCGA、DepMap 等 10+ 类权威数据库,进行靶点筛选、排序与验证。
自进化多智能体架构:系统具备自我学习和迭代优化能力,支持复杂生物学问题的多步推理,模拟人类生物学家的研究工作流。
机制导向分析:基于生物学机制路径进行深度推理,而非简单的关键词匹配,生成带有证据链的分析报告。
MCP 协议原生支持:通过 OrigeneMCP 服务器实现 600+ 生物信息学工具(BLAST、ClustalW 等)的标准化调用。
系统架构#
采用主从式 MCP 架构:
- 主应用:负责用户交互、任务规划、智能体调度和报告生成
- OrigeneMCP Server:独立微服务,封装生物信息学工具和数据库访问逻辑
支持多种 LLM 后端:OpenAI、DeepSeek、CloseAI 等,实现模型无关性。
应用场景#
- 新药研发早期的靶点筛选与验证
- 复杂疾病的分子机制解析
- 生物医学文献的综合问答与知识图谱构建
- 临床试验支持与靶点相关临床试验信息查询
部署与使用#
环境要求:Docker Engine 20.10+ 或 Python 3.13+
快速开始:
git clone https://github.com/GENTEL-lab/OriGene.git
cd OriGene
./setup.sh
运行模式:
- 交互模式:
make start - 快速研究:
make quick QUERY="your question" - 详细报告:
make detailed QUERY="your query"
TRQA 基准测试#
项目包含 TRQA(Therapeutic Research Question Answering)基准测试,涵盖 1,921 个专家级问题,用于评估生物医学 AI 智能体的性能,包括文献选择、数据库查询、短答案等多种题型。
开发团队#
GENTEL-lab(上海交通大学相关实验室),代码库和基准测试完全开源。