【资料图】

央广网北京6月24日消息(记者卜叶)近日,中国科学院软件研究所与中国科学院大学等单位合作,在代码审查意见自动生成方法研究方面取得进展。该研究提出了基于代码审查标记和预训练模型的代码审查意见自动生成方法,能够高效地对代码片段自动生成有意义的代码审查意见,帮助开发人员提高代码质量,缓解现有软件开发过程中严重依赖少数高水平程序员进行代码审查的难题,为提升软件开发过程中代码审查自动化能力起到重要支撑作用。

代码审查是保障软件质量的重要过程,然而在实际软件开发中,该过程往往严重依赖少数高水平程序员才能完成,一方面这可能造成多个软件开发过程中断并延迟,另一方面,即使是高水平程序员经验也是有限的,他们需要花费大量的时间进行代码审查,而且并不能保证审查出所有的代码错误或坏味。

针对此问题,研究团队提出一种基于代码审查标记和预训练模型的代码审查意见自动生成方法AUGER。他们从多个著名的Java项目中收集实际代码审查数据,通过代码审查标记嵌入技术构建出一个高质量数据集,利用T5预训练模型进行多策略多阶段训练。实验表明,该方法的ROUGE-L值相比于目前最好的方法提升了37.38%,且整个模型推理过程平均可在20秒内完成。

关键词: 新方法实现代码审查意见自动生成 代码审查 预训练模型