Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学曾云秀获国家专利权

中国人民解放军国防科技大学曾云秀获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学申请的专利基于大语言模型增强的可解释强化学习决策系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120722758B

龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511210997.8,技术领域涉及:G05B13/04;该发明授权基于大语言模型增强的可解释强化学习决策系统及方法是由曾云秀;黄鹤松;曾俊杰;石超;秦龙;柴娴;罗宇湘;李智能;何胜设计研发完成,并于2025-08-27向国家知识产权局提交的专利申请。

基于大语言模型增强的可解释强化学习决策系统及方法在说明书摘要公布了:本申请涉及一种基于大语言模型增强的可解释强化学习决策系统及方法。系统包括:白盒策略模块,含均采用软决策树构建的上层和下层策略模型,上层根据对抗态势数据和预设奖励函数决策输出上层子目标,下层依据上层子目标和对抗态势数据决策输出无人机控制量及行动轨迹数据;自然语言解释模块,利用决策行为解释大模型处理上、下层策略模型的软决策树参数、运算过程数据、预设奖励函数及无人机行动轨迹数据,输出行为解释内容;策略优化模块,利用决策行为优化大模型分析行为解释内容及无人机行动轨迹数据,结合交互数据提供奖励函数修改建议和失败轨迹修复方案。采用本系统可提高无人机对抗决策的智能性、实时性和可解释性。

本发明授权基于大语言模型增强的可解释强化学习决策系统及方法在权利要求书中公布了:1.一种基于大语言模型增强的可解释强化学习决策系统,其特征在于,所述可解释强化学习决策系统包括白盒策略模块、自然语言解释模块、策略优化模块和对抗环境模块;所述对抗环境模块用于提供对抗态势数据和交互数据; 所述白盒策略模块包括上层策略模型和下层策略模型,上层策略模型与下层策略模型均采用软决策树构建,所述上层策略模型用于根据所述对抗态势数据和预设奖励函数进行决策,输出宏观决策数据,宏观决策数据作为上层子目标输入下层策略模型,所述下层策略模型用于根据上层子目标和所述对抗态势数据进行决策,输出无人机控制量并生成无人机行动轨迹数据; 所述自然语言解释模块利用预先设置的决策行为解释大语言模型对上层策略模型、下层策略模型的软决策树参数、运算过程数据、所述预设奖励函数及无人机行动轨迹数据进行处理,输出单步决策逻辑、整体轨迹意图、策略行为模式的行为解释内容; 所述策略优化模块利用预先设置的决策行为优化大语言模型对所述行为解释内容及无人机行动轨迹数据进行分析处理,根据所述交互数据,为所述白盒策略模块提供预设奖励函数修改建议和失败轨迹修复方案; 所述上层策略模型和所述下层策略模型的训练过程包括: 采用预定义策略产生的行为数据初始化训练回放数据集;所述训练回放数据集包括高奖励回放数据集与低奖励回放数据集,通过选择概率控制高奖励回放数据集与低奖励回放数据集的应用频率; 训练过程中,上层策略模型基于从训练回放数据集采样的样本,通过梯度下降优化节点权重与路径概率参数; 下层策略模型在采用与所述上层策略模型相同的优化算法,并构建获取的上层子目标的目标权重矩阵;所述目标权重矩阵包括设置为最小值的已完成子目标权重、可动态调节的当前学习子目标的权重以及设置为0的未学习子目标的权重; 设置子目标计数器统计子目标的学习进度,当智能体完成一次有效子目标学习时,计数器自动累加,当计数器累计次数达到当前子目标设定的最大学习次数时,判定当前子目标学习完成并转入下一子目标学习,在连续多次未达到子目标最低阈值时,退回上一学习任务。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。