当前位置 : 首页 > 专利喜报 > 华东理工大学唐漾获国家专利权

华东理工大学唐漾获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉华东理工大学申请的专利面向群智夺旗博弈的深度强化学习方法和系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN115631165B 。

龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202211301852.5，技术领域涉及：G06T7/00；该发明授权面向群智夺旗博弈的深度强化学习方法和系统是由唐漾;杜文莉;钱锋设计研发完成，并于2022-10-24向国家知识产权局提交的专利申请。

本面向群智夺旗博弈的深度强化学习方法和系统在说明书摘要公布了：本发明公开了一种面向群智夺旗博弈的深度强化学习方法和系统，解决不完美信息条件下外部竞争、内部合作的群智路径规划与夺旗的问题。具体而言，首先基于卷积神经网络的分通道提取图片特征；然后，基于图注意力网络根据自身观测信息与接收到的队友观测信息，定量确定不完美信息条件下各智能体间的竞合关系，使得智能体在决策时，充分考虑其他智能体的状态；最后，根据对于场上不同智能体的注意力值，辅助多智能体双重决斗深度Q网络实现多智能体在二维迷宫环境中的路径规划与自主导航，优化群智夺旗策略，以实现快速、精准地二对二夺旗。

本发明授权面向群智夺旗博弈的深度强化学习方法和系统在权利要求书中公布了：1.一种面向群智夺旗博弈的深度强化学习方法，其特征在于，方法包括：步骤1：将复杂战场环境抽象为包括多个智能体在内的二维迷宫仿真环境；步骤2：基于卷积神经网络分通道提取输入图像的视觉特征；步骤3：使用强化学习双重决斗深度Q网络分别为分队的智能体初始化对应的网络，包括遵循策略得到智能体动作集中选取动作的动作概率，并且通过与迷宫环境的交互，转移到下一个状态并获得奖励以判断夺旗策略的好坏，初始状态由初始状态分布来决定；步骤4：根据群智夺旗任务目标构造奖励函数，根据由战场环境抽象出的夺旗规则，设置需要达到的目标；步骤5：在双重决斗深度Q网络结构中加入图注意力网络；步骤6：设置最大迭代轮次；步骤7：根据智能体在当前时刻的观测信息和与队友间的通讯信息，计算每一步各智能体间的注意力值，智能体根据注意力值选择偏向进攻防守的动作；步骤8：根据选取的奖励函数执行动作，获取经验回放四元组，其中智能体设置记忆以存储经验回放，获取经验回放四元组，经验回放四元组存放n个时刻；步骤9：获取新的环境部分观测，更新经验回放四元组，计算双重决斗深度Q网络目标值；步骤10：反复执行步骤7-9，更新双重决斗深度Q网络，直至迭代次数达到最大迭代次数，实现迷宫环境下的群智夺旗博弈。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人华东理工大学，其通讯地址为：200237 上海市徐汇区梅陇路130号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

华东理工大学唐漾获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务