CodeDPO – 北京大学联合字节共同推出的代码生成优化框架

1个月前发布 24 00

CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架,能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制,同时构建和评估代码及其测试用例,用PageRank算法迭代更新代码片段的排名,最终形成基于正确性和效率优化的数据集。CodeDPO不依赖外部资源,能够灵活、可扩展地生成多样化的偏好优化数据,为复杂现实场景中的代码...

收录时间:
2025-12-16
CodeDPO – 北京大学联合字节共同推出的代码生成优化框架CodeDPO – 北京大学联合字节共同推出的代码生成优化框架

CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架,能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制,同时构建和评估代码及其测试用例,用PageRank算法迭代更新代码片段的排名,最终形成基于正确性和效率优化的数据集。CodeDPO不依赖外部资源,能够灵活、可扩展地生成多样化的偏好优化数据,为复杂现实场景中的代码模型优化提供了坚实基础。

官网:https://arxiv.org/pdf/2410.05605


立即打开官网

数据统计

相关导航