Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 腾讯科技(深圳)有限公司王慧敏获国家专利权

腾讯科技(深圳)有限公司王慧敏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉腾讯科技(深圳)有限公司申请的专利可持续学习模型的训练方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115115057B

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210348872.1,技术领域涉及:G06N20/00;该发明授权可持续学习模型的训练方法、装置、设备及存储介质是由王慧敏;张云燕;杨奕凡设计研发完成,并于2022-04-01向国家知识产权局提交的专利申请。

可持续学习模型的训练方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种可持续学习模型的训练方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:基于可持续学习模型获取未学习的新任务数据;根据新任务数据获取可持续学习模型的第一损失;基于可持续学习模型和已学习的旧任务数据,获取可持续学习模型的第二损失;基于可持续学习模型、旧任务数据和新任务数据,获取可持续学习模型的第三损失;根据第一损失、第二损失和第三损失,对可持续学习模型进行训练。本申请中,通过第一损失、第二损失和第三损失进行模型训练,提高可持续学习模型的准确性和泛化性,减少可持续学习模型的旧知识遗忘,进而提高可持续学习模型的实用性。

本发明授权可持续学习模型的训练方法、装置、设备及存储介质在权利要求书中公布了:1.一种可持续学习模型的训练方法,其特征在于,所述方法包括: 基于所述可持续学习模型获取未学习的新任务数据,所述新任务数据包括多个状态转移信息,所述状态转移信息包括状态信息、所述状态信息对应的动作信息、所述动作信息的奖励信息和所述动作信息对应的下一个状态信息;其中,所述状态信息是基于自动对话系统中的查询文本确定的,所述状态信息对应的动作信息是由所述可持续学习模型的策略网络根据所述状态信息,输出的所述查询文本对应的应答文本; 根据所述新任务数据获取所述可持续学习模型的第一损失,所述第一损失用于衡量所述可持续学习模型针对所述新任务数据的预测结果与标准结果之间的差异; 基于所述可持续学习模型和已学习的旧任务数据,获取所述可持续学习模型的第二损失,所述第二损失用于衡量所述可持续学习模型针对所述旧任务数据的遗忘程度; 将所述新任务数据输入至所述可持续学习模型的策略网络中,得到第一经验风险和第一梯度范数惩罚;其中,所述第一经验风险用于指示所述策略网络针对所述新任务数据的输出结果的准确性,所述第一梯度范数惩罚用于指示所述策略网络针对所述新任务数据的泛化性; 将所述旧任务数据输入至所述策略网络中,得到第二经验风险和第二梯度范数惩罚;其中,所述第二经验风险用于指示所述策略网络针对所述旧任务数据的输出结果的准确性,所述第二梯度范数惩罚用于指示所述策略网络针对所述旧任务数据的泛化性; 根据所述第一经验风险、所述第一梯度范数惩罚、所述第二经验风险和所述第二梯度范数惩罚,确定第三损失,所述第三损失用于衡量所述可持续学习模型由所述旧任务数据到所述新任务数据的迁移能力; 根据所述第一损失、所述第二损失和所述第三损失,对所述可持续学习模型进行训练。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。