Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 成都西南信息控制研究院有限公司付小锋获国家专利权

成都西南信息控制研究院有限公司付小锋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉成都西南信息控制研究院有限公司申请的专利多智能体模型及训练系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115054923B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210693621.7,技术领域涉及:A63F13/67;该发明授权多智能体模型及训练系统和方法是由付小锋;李執平;文扬;赖真;李刚设计研发完成,并于2022-06-18向国家知识产权局提交的专利申请。

多智能体模型及训练系统和方法在说明书摘要公布了:本发明公开了一种多智能体模型及训练系统和方法,以改进的MADDPG模型作为多智能体模型,在模型训练过程中引入仿真模块和专家模块,使用策略编号和下一步动作序列作为多智能体模型输出,通过专家模块对动作序列进行修正更新,协助多智能体之间灵活通信和对全局信息的考虑,且能够很好利用现有专家经验,在提升训练速度的同时,使训练得到智能体更加稳定性。

本发明授权多智能体模型及训练系统和方法在权利要求书中公布了:1.一种多智能体模型的训练系统,其特征在于,包括通信连接的仿真模块、多智能体训练模块和专家模块;所述多智能体模型包括多个并行设置的智能体,各智能体包括结构相同的Actor策略网络和Critic评价网络,网络结构均包括六层全连接层,每两层全连接网络后引入残差层,全连接层和残差层后均设置ReLU激活函数;以多智能体模型中的多个智能体构成己方,并将多个智能体添加于仿真模块的对抗场景中; 所述仿真模块用于生成各智能体的当前观测序列、当前环境回报和累计回报;每个智能体的观测序列包括拼接在一起的当前智能体的状态信息和位置信息,己方其它智能体状态信息和相对位置信息,当前智能体探测到的敌方的状态信息和相对位置信息,以及己方其它智能体探测到的敌方智能体状态信息和相对位置信息; 所述多智能体训练模块用于依据来自仿真模块的各智能体的当前观测序列,输出策略编号序列和第一动作序列; 所述专家模块用于依据来自多智能体训练模块的策略编号序列,通过投票策略选取其中的一个策略编号对应的映射策略作为执行策略;同时依据执行策略和来自仿真模块的各智能体的观测序列,得到第二动作序列;再对第一动作序列和第二动作序列进行加权平均得到多智能体下一步动作序列,反馈给仿真模块。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都西南信息控制研究院有限公司,其通讯地址为:611730 四川省成都市成都高新区蜀新大道1288号1栋、3栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。