FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准

4个月前发布 138 00

FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编程场景，包含3374个问题，涉及16种编程语言，能更有效地衡量大模型在现实世界中的代码开发能力。FullStack Bench基于模拟真实编程应用领域...

收录时间：

2025-12-16

打开网站手机查看

FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准

FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准

FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编程场景，包含3374个问题，涉及16种编程语言，能更有效地衡量大模型在现实世界中的代码开发能力。FullStack Bench基于模拟真实编程应用领域，提供一个全面、多领域的评估平台，有助于推动代码智能技术的进步。

官网：https://github.com/bytedance/FullStackBench

立即打开官网

数据统计

相关导航

Pangea – 卡内基梅隆大学开源的多语言多模态大语言模型

Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言模...

Dify – 开源的生成式AI应用开发平台

Dify是开源的生成式 AI应用开发平台，帮助用户快速构建...

DeepRant 鲸喷 – 专为游戏玩家设计的多语言快捷翻译开源工具

DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具...

MMMLU – OpenAI推出的多语言大规模多任务语言理解数据集

MMMLU（多语言大规模多任务语言理解）是OpenAI推出的...

Llama 3.3 – Meta AI推出的纯文本语言模型

Llama 3.3是Meta AI推出的70B 参数模型，大...

SimplifyAI – AI文档在线翻译平台，保持原文档的排版格式

SimplifyAI 是AI文档在线翻译平台，专注于提供高质...

Granite 3.1 – IBM 推出的新版语言模型

Granite 3.1是IBM推出的新一代语言模型，具有强大...

GOT-OCR2.0 – 开源的端到端OCR模型，多语言多模态识别，多样化输入输出

GOT-OCR 2.0是一种先进的光学字符识别（OCR）模型...