Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 同济大学赵一航获国家专利权

同济大学赵一航获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉同济大学申请的专利基于注意力机制的深度强化学习集群对抗方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119962616B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510450376.0,技术领域涉及:G06N3/092;该发明授权基于注意力机制的深度强化学习集群对抗方法和系统是由赵一航;衣鹏;雷金龙;洪奕光;王晓晓;刘大卫设计研发完成,并于2025-04-11向国家知识产权局提交的专利申请。

基于注意力机制的深度强化学习集群对抗方法和系统在说明书摘要公布了:本发明提供一种基于注意力机制的深度强化学习集群对抗方法和系统,包括小规模对抗场景下的嵌入注意力模块的深度强化学习模型的训练,以及大规模对抗场景下组别划分以及小组成员确定,并基于深度强化学习模型进行对抗指导。本方案中,基于注意力机制能够实现不同阵营和类型的智能体的个体权重以及其状态信息权重的配置,进而提高智能体在高动态环境下的决策效率和准确性。在大规模场景下进行组别划分和小组内成员确定,可以确保每个智能体能够根据当前态势有效地执行任务。通过集成注意力机制与深度强化学习技术,可实现智能体在动态复杂环境下的高效协同作战能力。

本发明授权基于注意力机制的深度强化学习集群对抗方法和系统在权利要求书中公布了:1.一种基于注意力机制的深度强化学习集群对抗方法,其特征在于,用于实现智能体在动态复杂环境下的高效协同作战能力,所述方法包括: 构建集群对抗模型,所述集群对抗模型包括智能体集群和对抗仿真场景,所述智能体集群包括多个不同阵营、不同类型的智能体,所述对抗仿真场景包括对抗仿真环境和保护点,所述智能体为机器人智能体、无人机智能体或网络节点智能体; 选取所述集群对抗模型中的部分智能体及保护点对嵌入有注意力模块的深度强化学习模型进行训练; 基于所述智能体集群中的所有智能体进行组别划分,并在所有组别的各小组内为各所述智能体选择所属同阵营的智能体以及所属不同阵营的智能体,并确定各所述小组内的保护点; 将所有小组内的智能体以及保护点输入训练完成的深度强化学习模型中,输出各所述智能体的动作信息,其中,将各智能体的当前的观测信息和动作信息输入深度强化学习模型中,输出下一时刻的动作信息,动作信息包括加速度信息,所述深度强化学习模型中的注意力模块动态调整各智能体对其他智能体状态信息的关注程度; 以所述动作信息指导各所述智能体在所述对抗仿真环境内进行仿真对抗,其中,在每次仿真对抗的每个时间步内,以所述时间步得到的加速度信息指导各所述智能体在所述对抗仿真环境内运动,统计多次仿真对抗中不同阵营的智能体的对抗结果,并分析不同阵营的智能体的成功率和失败率;所述选取所述集群对抗模型中的部分智能体及保护点对嵌入有注意力模块的深度强化学习模型进行训练的步骤,包括: 针对所述集群对抗模型中部分智能体,基于Embed函数构建所述智能体的嵌入表示,将所述嵌入表示输入深度强化学习模型的注意力模块中; 基于所述注意力模块输出各所述智能体对应的其他智能体的嵌入表示,并将所述智能体的嵌入表示与所述其他智能体的嵌入表示在全连接层进行拼接并处理后得到决策信息; 基于为各所述智能体构建的损失函数以及所述决策信息对所述深度强化学习模型进行训练,直至满足预设停止条件时停止训练。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200082 上海市杨浦区四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。