DeepResearch Bench:深度研究代理综合基准✨一个包含100个博士级研究任务的基准测试平台,涵盖22个不同领域,用于系统性评估深度研究代理(DRA)的报告生成质量和信息检索能力。Python大语言模型深度学习查看详情 →