发现 AI 代理的未来arrow_forward

全部项目

1 个项目

BigCodeBench:大型语言模型代码生成基准测试平台

🧠

一个用于评估大型语言模型代码生成能力的基准测试平台,包含1140个软件工程导向的编程任务,分为完整和指令两种模式,可测试模型在复杂指令和多样化函数调用场景下的编程能力。

PythonPyTorch大语言模型
每页

第 1 / 1 页 · 共 1 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch