当前位置 : 首页 > 专利喜报 > 中国科学技术大学秦家虎获国家专利权

中国科学技术大学秦家虎获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉中国科学技术大学申请的专利一种基于多智能体强化学习的人与集群交互的方法和系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121390198B 。

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202511978494.5，技术领域涉及：G06N3/092；该发明授权一种基于多智能体强化学习的人与集群交互的方法和系统是由秦家虎;吴子鹏;马麒超;刘轻尘;李曼设计研发完成，并于2025-12-25向国家知识产权局提交的专利申请。

本一种基于多智能体强化学习的人与集群交互的方法和系统在说明书摘要公布了：本发明涉及智能体协作技术领域，公开了一种基于多智能体强化学习的人与集群交互的方法和系统。方法包括：基于多智能体强化学习算法构建无人移动平台集群的对抗策略模型；利用基于注意力机制的状态威胁评估模块处理对抗双方的状态，输出对敌方目标的威胁评估系数；基于观测空间和威胁评估系数对状态威胁评估模块和对抗策略模型进行联合训练；将人类威胁评估系数与威胁评估系数融合，得到混合威胁评估系数；将所述混合威胁评估系数与无人移动平台的观测状态结合，输入至训练后的所述对抗策略模型，以生成并执行指导所述无人移动平台集群进行对抗的协作动作。本发明提高集群的协同作战能力和任务完成效率，能够更好地应对变化的战场环境。

本发明授权一种基于多智能体强化学习的人与集群交互的方法和系统在权利要求书中公布了：1.一种基于多智能体强化学习的人与集群交互的方法，其特征在于，包括：基于多智能体强化学习算法构建无人移动平台集群的对抗策略模型，定义无人移动平台集群对抗任务的观测空间和动作空间；利用基于注意力机制的状态威胁评估模块处理对抗双方的状态，输出对各敌方目标的威胁评估系数，具体包括：采用自注意力机制聚合己方集群中各无人移动平台的状态，得到己方集群的混合状态向量；以己方集群的混合状态向量作为查询向量，以敌方集群中各无人移动平台的状态集合作为键向量和值向量，通过交叉注意力机制，计算得到敌方集群混合状态向量，并通过注意力权重的分配生成对敌方集群各无人移动平台的威胁评估系数；基于观测空间和威胁评估系数对状态威胁评估模块和对抗策略模型进行联合训练，具体包括：对抗策略模型包括价值网络与策略网络，价值网络用来评估当前状态的价值，策略网络用来为各无人移动平台选择要执行的动作；设计优势角度奖励项、攻击范围奖励项、成功击毁奖励项及任务完成奖励项，并引入威胁评估系数为各奖励项设置权重，通过加权求和得到最终的奖励函数，使无人移动平台在决策时优先关注具有更高威胁的敌方目标；多智能体强化学习算法采用集中式训练分布式执行的训练范式，训练对抗策略模型，将无人移动平台的观测空间作为策略网络的输入，策略网络输出当前无人移动平台的动作并应用在环境中；将所有无人移动平台的观测空间拼接为全局状态空间，作为价值网络的输入，价值网络输出当前全局状态空间的价值，以此来评估策略网络输出的动作；提供具有可视化交互界面的交互模块，用于供用户观察对抗态势并输入人类威胁评估系数；将人类威胁评估系数与威胁评估系数进行融合，得到混合威胁评估系数；将所述混合威胁评估系数与无人移动平台的观测状态结合，输入至训练后的所述对抗策略模型，以生成并执行指导所述无人移动平台集群进行对抗的协作动作。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人中国科学技术大学，其通讯地址为：230026 安徽省合肥市包河区金寨路96号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

中国科学技术大学秦家虎获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务