青岛科技大学王国涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉青岛科技大学申请的专利基于全景视觉感知与语言模型推理的水下导航方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121140810B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511704617.6,技术领域涉及:G01C21/20;该发明授权基于全景视觉感知与语言模型推理的水下导航方法及系统是由王国涛;王景景;赵星月;颜舒琳;施威设计研发完成,并于2025-11-20向国家知识产权局提交的专利申请。
本基于全景视觉感知与语言模型推理的水下导航方法及系统在说明书摘要公布了:本发明属于人工智能技术领域,涉及基于全景视觉感知与语言模型推理的水下导航方法及系统。该方法通过获取水下机器人运行时的360°全景视频序列,经预处理后,将其划分为子视图并提取视觉特征,再结合位置与动作嵌入信息,经由Transformer网络聚合为时空轨迹特征流。通过在语言模型中嵌入适配模块,利用交叉注意力机制将视觉轨迹特征注入语言隐空间,实现视觉‑语言信息融合与内容推理。同时,通过三维场景建模构建语义场景表示,并借助地标不确定性评估模块抑制幻觉地标,最终将语言模型的推理输出映射为结构化的控制指令。该方法实现了水下环境中基于内容理解的自主语义导航。
本发明授权基于全景视觉感知与语言模型推理的水下导航方法及系统在权利要求书中公布了:1.一种基于全景视觉感知与语言模型推理的水下导航方法,其特征在于,包括以下步骤: 1采集水下机器人在运行过程中的360°全景视频序列,对采集的视频进行预处理,得到稳定的全景图像序列; 2将每帧全景图像划分为若干子视图,利用预训练的视觉编码网络提取子视图特征,并结合位置嵌入与动作嵌入信息,经Transformer聚合形成时空轨迹特征序列; 3在大语言模型的多层结构中插入适配模块,所述适配模块通过交叉注意力机制将轨迹特征映射至语言隐空间中,实现视觉与语言信息的动态融合; 4将连续视觉数据经深度估计与几何重投影转换为体素化三维结构表示,构建包含空间拓扑、障碍关系与语义分布的三维场景模型; 5对语言生成的地标进行置信度分析,融合语言生成概率与视觉特征相似度,计算联合置信度并抑制幻觉地标; 6根据语义推理结果生成结构化控制命令,将方向词映射为方向控制信号,并结合地标位姿调整量生成最终导航控制指令,实现水下机器人的自主内容导航。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛科技大学,其通讯地址为:266100 山东省青岛市崂山区松岭路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励