集美大学李裕钦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉集美大学申请的专利一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119840806B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411867067.5,技术领域涉及:B63B79/20;该发明授权一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统是由李裕钦;吴德烽;黎国强;武东杰;游政;陈国权;涂婉丽设计研发完成,并于2024-12-18向国家知识产权局提交的专利申请。
本一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统在说明书摘要公布了:本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1,收集专家避碰数据;步骤2,训练扩散模型;步骤3,进行数据增强;步骤4,搭建训练环境;步骤5,构建生成器和判别器;步骤6,更新判别器;步骤7,更新生成器;步骤8,完成训练。通过有限专家样本数据训练扩散模型,使用所训练的扩散模型生成额外避碰数据,额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划,对本发明提出的算法进行验证,理论与实际相结合形成系统性方案。
本发明授权一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统在权利要求书中公布了:1.一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法,其特征在于,包括以下步骤: 步骤1,收集基于SoftActor-Critic的专家避碰模型在仿真环境中的专家避碰数据; 步骤2,通过将噪声添加到输入数据中,并利用反向传播算法更新神经网络权重,以最小化神经网络预测噪声与实际添加噪声之间的差异训练扩散模型; 步骤3,进行数据增强;在数据增强过程中,扩散模型从一组随机噪声开始,通过利用步骤2中训练好的神经网络逐步去除噪声,生成与真实数据分布相似的样本;通过多个时间步的去噪操作,扩散模型能够从完全随机的噪声生成类似于原始数据分布的额外样本; 步骤4,使用船舶运动模型搭建训练环境; 步骤5,构建生成器和判别器; 步骤6,更新判别器; 步骤7,更新生成器; 步骤8,完成训练; 所述步骤2中扩散模型由三层全连接神经网络组成,衡量所述差异的损失函数如下: 其中为神经网络参数,为神经网络预测噪声,为实际添加噪声,为实际 数据,为噪声分布的期望; 所述步骤2中训练扩散模型具体包括以下步骤: 步骤2.1,对专家避碰数据进行采样,得到采样数据; 步骤2.2,选择一个时间步,是从均匀分布中随机采样得到;对采样数据添加噪声 生成带噪声的数据;噪声大小由与设定的噪声调度控制;是线性均匀分布的,即的 计算如下式2所示: 其中是初始噪声强度,表示最终噪声强度,表示时间步总数; 步骤2.3,使用参数为的神经网络预测噪声; 步骤2.4,计算损失函数; 步骤2.5,通过反向传播算法,根据更新模型的参数,以最小化预测噪声与真实噪 声的差异。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人集美大学,其通讯地址为:361021 福建省厦门市集美区银江路185号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励