西安腾坤电子科技有限公司聂许获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安腾坤电子科技有限公司申请的专利多模态与强化学习结合的海上落水人员搜寻方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121459396B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610002912.5,技术领域涉及:G06V40/10;该发明授权多模态与强化学习结合的海上落水人员搜寻方法及系统是由聂许;秦浩设计研发完成,并于2026-01-05向国家知识产权局提交的专利申请。
本多模态与强化学习结合的海上落水人员搜寻方法及系统在说明书摘要公布了:本申请公开了一种多模态与强化学习结合的海上落水人员搜寻方法及系统。该方法包括:采集包括可见光图像数据、红外图像数据与雷达点云数据的传感器数据,并进行高精度时空对齐;提取各传感器数据的图像特征,拼接后通过编码器融合为统一编码特征向量;同时采集雨雾等级、光照强度等环境数据并编码为环境编码;将编码特征向量与环境编码输入由LSTM和PPO算法驱动的组合策略网络,动态计算各传感器数据的权重;基于权重对图像特征进行自适应加权融合,最终通过目标检测算法输出搜寻结果。本申请实现了在复杂海况下对传感器资源的智能调度与多传感器数据的深度融合,有效提升了搜寻精度、响应速度与系统能效。
本发明授权多模态与强化学习结合的海上落水人员搜寻方法及系统在权利要求书中公布了:1.一种多模态与强化学习结合的海上落水人员搜寻方法,其特征在于,包括: 利用部署在目标区域的多个传感器采集所述目标区域的多个传感器数据,对多个所述传感器数据进行时空对齐处理,得到所述目标区域的多个传感器对齐数据; 分别提取多个所述传感器对齐数据的图像特征,将多个所述图像特征拼接成一个特征向量并利用编码器将所述特征向量转换为编码特征向量; 采集所述目标区域的多个环境数据,将多个所述环境数据转换为环境向量,利用全连接网络对所述环境向量进行编码得到环境编码; 基于所述编码特征向量与所述环境编码通过组合策略网络计算每个传感器的权重,包括:所述组合策略网络中的全连接层中,利用所述编码特征向量与所述环境编码计算出总编码; 计算出所述总编码的计算公式为: ; 其中,表示所述总编码,表示所述环境编码,表示权重计算参数,偏置计算参数,表示所述编码特征向量; 在所述组合策略网络中的决策层中利用所述编码特征向量、所述环境编码与所述总编码计算出隐藏状态; 计算出所述隐藏状态的计算公式为: ; 其中: ; ; ; 其中,表示所述隐藏状态,表示当前时刻的状态,表示第三输出向量,表示逐元素相乘,表示第一输出向量,表示Sigmoid激活函数,表示第二输出向量,和分别表示遗忘门和输入门对应的权重矩阵,和表示遗忘门和输入门对应的偏置向量,表示双曲正切激活函数,表示当前时刻的状态对应的权重矩阵,表示当前时刻的状态对应的偏置向量; 在所述组合策略网络中的输出层中利用所述隐藏状态计算出每个所述传感器的所述权重; 利用强化学习算法优化所述组合策略网络的性能,以更新所述权重,所述利用强化学习算法优化所述组合策略网络的性能,包括: 计算奖励函数以评估所述组合策略网络的性能; 计算所述奖励函数的计算公式为: ,; 其中,表示所述奖励函数,表示任务完成度,表示能耗,表示处理延迟,表示可见光权重,表示红外权重,表示雷达权重; 利用PPO算法中的交替更新策略和价值函数方式优化所述组合策略网络的性能,得到最大化所述奖励函数的所述组合策略网络; 其中,所述PPO算法中的所述交替更新策略步骤为: 经验收集:使用当前的所述组合策略网络与系统交互,采集状态、动作、奖励及后续状态序列; 优势估计:利用当前价值函数网络和收集的所述奖励,通过广义优势估计算法计算每个时间步的优势值,用以评估动作的相对优劣; 策略网络更新:固定价值函数网络,通过梯度上升最大化PPO-Clip的目标函数,优化策略网络参数: ; 其中,表示PPO算法的目标函数,表示策略网络参数,表示对时间步t的数学期望,表示组合策略网络中新旧策略的概率比,表示广义优势估计计算的优势函数,表示剪裁函数; 价值函数网络更新:固定所述策略网络,通过梯度下降最小化以下均方误差损失,优化所述价值函数的网络参数,使其预测更接近实际回报: ; 其中,表示均方误差损失,表示价值函数的网络参数,表示目标回报,目标回报还可以使用折扣累积奖励计算,表示由控制的状态价值函数,表示时间步t的状态; 迭代优化:重复执行策略网络更新与价值函数网络更新多次,完成一次迭代内的交替更新,随后用更新后的策略网络进行新的经验收集,如此循环迭代,直至奖励函数R收敛至最大值,从而得到性能最优化的组合策略网络; 利用多个所述权重对多个所述图像特征进行加权融合得到融合特征向量,利用目标检测算法识别所述融合特征向量得到所述目标区域中的目标结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安腾坤电子科技有限公司,其通讯地址为:710000 陕西省西安市高新区丈八一路1号汇鑫中心A座2206室X091;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励