Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学鲁义威获国家专利权

中国人民解放军国防科技大学鲁义威获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学申请的专利基于强化学习的应急通信节点要素部署方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119907012B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510117609.5,技术领域涉及:H04W16/18;该发明授权基于强化学习的应急通信节点要素部署方法及系统是由鲁义威;黄博;杨若鹏;殷昌盛;杨远涛;王石杰;陶宇;石永琪设计研发完成,并于2025-01-24向国家知识产权局提交的专利申请。

基于强化学习的应急通信节点要素部署方法及系统在说明书摘要公布了:本公开属于应急通信节点要素部署技术领域,具体提供了基于强化学习的应急通信节点要素部署方法及系统,包括:基于深度强化学习,采用具有编译码架构的全卷积神经网络作为价值网络,根据不同环境因素及当前请求部署的要素类型进行智能体状态设计;训练神经网络模型;依据应急区域构建路网地图,输入至训练好的神经网络模型,输出要素部署方案。本公开基于深度Q学习的全新算法。该算法将全卷积神经网络作为价值网络,并使用经验回放区中积累的数据对网络进行训练。相较于人工部署,实验结果表明,提出的方法能较好地完成应急通信节点要素规划任务,极大地提升了应急通信节点的部署效率。

本发明授权基于强化学习的应急通信节点要素部署方法及系统在权利要求书中公布了:1.基于强化学习的应急通信节点要素部署方法,其特征在于,包括: S1,基于深度强化学习,采用具有编译码架构的全卷积神经网络作为价值网络,根据不同环境因素及当前请求部署的要素类型进行智能体状态设计; S2,训练神经网络模型; 其中,所述S2包括: S21,从经验回放区B中随机小批量选取H个{si,ai,ri,si+1},用于训练神经网络; S22,对动作空间A进行采样,步长为2,采样后动作空间将有n24个动作,而后将提取出其中道路和具有部署能力区域,进行价值的计算;其中,动作空间A包含n×n个动作; S23,使用目标网络计算si+1状态下最佳的动作amax=argmaxQwsi+1,a,并计算该动作在目标网络下的价值[Qw-si+1,amax],作为该点动作at的价值,动作空间A′中所有动作的最大价值qmax构成集合Q′t+1; S24,采用双线性插值,将Q′t+1的大小变回n×n; S25,取动作空间A′具有最大价值的动作at+1max,交予目标网络进行计算,目标网络参数w-,价值网络参数为w,Qw为价值网络,Qw-为目标网络,得到预估的下一步价值Q′,采用时序差分算法,计算目标价值矩阵R+γQ′; Q′=Qw-st+1,argmaxQwst+1,a S26,通过比较估计价值矩阵Q与目标价值矩阵R+γQ′来量化模型的误差,设计模型损失函数loss,并采用随机梯度下降法,更新价值网络参数; 其中,Rj为各奖励分项,st,at,rt分别为t时刻的状态、动作和奖励,γ为折扣因子; S3,依据应急区域构建路网地图,输入至训练好的神经网络模型,输出要素部署方案。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:430030 湖北省武汉市硚口区古田街道罗家墩122号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。