BigCodeBench:大型语言模型代码生成基准测试平台
🧠一个用于评估大型语言模型代码生成能力的基准测试平台,包含1140个软件工程导向的编程任务,分为完整和指令两种模式,可测试模型在复杂指令和多样化函数调用场景下的编程能力。
PythonPyTorch大语言模型
一个用于评估大型语言模型代码生成能力的基准测试平台,包含1140个软件工程导向的编程任务,分为完整和指令两种模式,可测试模型在复杂指令和多样化函数调用场景下的编程能力。
第 1 / 1 页 · 共 1 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。