深圳大学毛斐巧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳大学申请的专利基于多任务学习的代码表征模型的训练方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121094010B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511650065.5,技术领域涉及:G06N3/0455;该发明授权基于多任务学习的代码表征模型的训练方法及装置是由毛斐巧;余东旭;郭嘉锋;梁正平设计研发完成,并于2025-11-12向国家知识产权局提交的专利申请。
本基于多任务学习的代码表征模型的训练方法及装置在说明书摘要公布了:本发明适用人工智能技术领域,提供了一种基于多任务学习的代码表征模型的训练方法及装置,该代码表征模型包括预处理模块、代码任务编码器以及代码任务解码器,该方法包括:利用预处理模块对多个目标代码任务的代码样本进行序列化处理,得到代码样本的代码标记序列、线性化AST结构序列以及NL标记序列,生成代码表征序列;利用代码任务编码器对代码表征序列进行特征提取,得到深层语义表征;利用代码任务解码器对深层语义表征进行解码,得到对应的解码序列;计算每个目标代码任务的任务学习损失以及动态权重,进一步计算当前训练的总学习损失,根据总学习损失,对代码表征模型的参数进行更新,继续对代码表征模型进行训练,直至训练结束。
本发明授权基于多任务学习的代码表征模型的训练方法及装置在权利要求书中公布了:1.一种基于多任务学习的代码表征模型的训练方法,其特征在于,所述代码表征模型包括预处理模块、代码任务编码器以及代码任务解码器,所述代码任务编码器为Transformer编码器,所述代码任务解码器为Transformer解码器,所述方法包括下述步骤: 利用所述预处理模块对多个目标代码任务的代码样本进行序列化处理,得到所述代码样本的代码标记序列、线性化抽象语法树结构序列以及自然语言标记序列,基于所述代码标记序列、线性化抽象语法树结构序列以及自然语言标记序列,生成每个目标代码任务的代码表征序列,所述代码样本包括多个源代码,每个源代码对应一个目标代码任务,所述目标代码任务为对输入的源代码执行的操作,所述目标代码任务包括代码补全、代码翻译以及代码漏洞修复; 将每个目标代码任务的代码表征序列输入到相应的代码任务编码器,利用所述代码任务编码器对所述代码表征序列进行特征提取,得到深层语义表征; 将每个代码任务编码器输出的深层语义表征输入到相应的代码任务解码器中,利用所述代码任务解码器对所述深层语义表征进行解码,得到对应的解码序列; 基于所述多个目标代码任务的代码样本以及目标代码,计算每个目标代码任务的任务学习损失以及动态权重,根据每个目标代码任务的任务学习损失以及动态权重,计算当前训练的总学习损失,根据所述总学习损失,对所述代码任务编码器以及代码任务解码器的参数进行更新,继续对所述代码表征模型进行训练,直至训练结束,以得到训练好的代码表征模型,所述训练好的代码表征模型用于处理多个代码任务; 利用所述预处理模块对多个目标代码任务的代码样本进行序列化处理,得到所述代码样本的代码标记序列、线性化抽象语法树结构序列以及自然语言标记序列的步骤,包括: 对所述代码样本进行词法分析,得到所述代码样本的代码标记序列; 获取所述代码样本的抽象语法树以及自然语言标记序列,对所述抽象语法树进行线性化处理,得到所述代码样本的线性化抽象语法树结构序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳大学,其通讯地址为:518000 广东省深圳市南山区南海大道3688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励