SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法

1个月前发布 38 00

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性能。SaRA能提高模型的适应性和泛化能力,显著降低计算成本,只要修改一行代码即可实现,具有很高的实用价值。官网:ht...

收录时间:
2025-12-16
SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性能。SaRA能提高模型的适应性和泛化能力,显著降低计算成本,只要修改一行代码即可实现,具有很高的实用价值。

官网:https://github.com/sjtuplayer/SaRA


立即打开官网

数据统计

相关导航