Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖南大学王耀南获国家专利权

湖南大学王耀南获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖南大学申请的专利面向人形机器人抓取的稀疏视角三维高斯语言场构建方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121245866B

龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511824991.X,技术领域涉及:B25J9/16;该发明授权面向人形机器人抓取的稀疏视角三维高斯语言场构建方法和系统是由王耀南;张谊科;谭浩然;李佺振;黄凯真;王飞文;张辉;毛建旭设计研发完成,并于2025-12-05向国家知识产权局提交的专利申请。

面向人形机器人抓取的稀疏视角三维高斯语言场构建方法和系统在说明书摘要公布了:本发明公开了一种面向人形机器人抓取的稀疏视角三维高斯语言场构建方法和系统。包括:获取稀疏视角下的RGB图像集和用户自然语言指令;通过立体匹配重建三维点云,经噪声消除与度量对齐后,初始化三维高斯原语场;将二维语义特征嵌入该场中,通过双路径语义监督模块进行联合优化,构建语义一致的三维高斯语言场;其中,双路径语义监督包括对象感知路径与全局上下文路径,分别约束局部语义一致性与整体语义关系,并通过加权融合得到各高斯原语的最终语义表示;最后生成候选抓取姿态,结合语言指令进行语义重排序,通过几何‑语义联合评分筛选最优抓取姿态。能够在稀疏图像集输入条件下,提升机器人抓取任务在复杂指令下的执行准确率。

本发明授权面向人形机器人抓取的稀疏视角三维高斯语言场构建方法和系统在权利要求书中公布了:1.面向人形机器人抓取的稀疏视角三维高斯语言场构建方法,其特征在于,包括以下步骤: S100:获取来自稀疏视角的RGB输入图像集及用户自然语言指令; S200:基于输入的图像集,通过立体匹配模型生成三维点图,并进行全局融合与噪声消除; S300:处理后的三维点图与机器人坐标系的度量对齐,得到度量对齐的三维点云,并基于该点云初始化三维高斯原语场; S400:将二维图像语义特征投影并嵌入到三维高斯原语场中,通过双路径语义监督模块进行联合优化,以形成语义一致的三维高斯语言场;其中,联合优化包括:通过对象感知语义监督路径约束局部语义一致性;通过全局上下文语义监督路径约束整体语义关系;将双路径输出的语义特征进行加权融合,得到每个高斯原语的最终语义表示;通过组合双路径的监督损失函数,对三维高斯原语场的几何与语义属性进行联合训练优化; S500:在三维高斯语言场上,基于几何稳定性生成候选抓取姿态,然后基于自然语言指令的语义相关性对候选抓取进行重排序,最后通过几何与语义联合评分筛选出最终抓取姿态,控制人形机器人根据最终抓取姿态完成抓取任务; S400中通过对象感知语义监督路径约束局部语义一致性,包括: S410:语义掩码生成:对每张输入图像使用分割模型SAM生成语义掩码集合,每个掩码对应一个候选物体区域; S420:局部特征提取:在各掩码区域内,通过语义编码模型CLIP提取局部语义特征向量; S430:三维投影映射:将掩码内的像素通过相机参数投影至三维高斯原语场,确定覆盖该掩码的高斯原语子集; S440:语义一致性约束:计算高斯原语子集的语义特征均值: ; 其中,为第k个高斯原语的语义特征,为子集中的第k个高斯原语,为覆盖第i张图像第j个掩码的高斯原语子集,为该子集中高斯原语的数量; 并通过损失函数约束语义特征均值与从图像掩码提取的局部语义特征保持一致,定义为: ; 其中,为对象感知语义损失函数,为从第i张图像第j个掩码提取的语义特征,为对应高斯原语子集的语义特征均值; S400中通过全局上下文语义监督路径约束整体语义关系;将双路径输出的语义特征进行加权融合,得到每个高斯原语的最终语义表示;通过组合双路径的监督损失函数,对三维高斯原语场的几何与语义属性进行联合训练优化,包括: S450:全局语义特征提取:对每张输入图像使用视觉-语言模型提取全局语义特征; S460:全局语义一致性约束:将整张图像的语义特征作为软标签,计算所有高斯原语语义特征的平均值: ; 其中,表示高斯原语的总数量,表示所有高斯原语的集合; 并通过损失函数约束该平均值与图像的全局语义特征保持一致,定义为: ; 其中,为全局语义一致性损失函数,为从第i张图像提取的全局语义特征,为所有高斯原语语义特征的平均值; S470:双路径特征融合:将对象感知路径得到的特征与全局上下文路径得到的特征进行加权融合,得到每个高斯原语的最终语义表示: ; 其中,为第k个高斯原语的最终语义表示,为对象感知路径的权重系数,为全局上下文路径的权重系数,,为第k个高斯原语在对象感知路径下的语义特征,为第k个高斯原语在全局上下文路径下的语义特征; S480:整体优化:双路径语义监督的整体损失函数为: ; 其中,为用于控制全局监督强度的权重系数; S500中在三维高斯语言场上,基于几何稳定性生成候选抓取姿态,具体包括: S510:在重建的三维高斯场中,以目标物体为中心构建工作空间,其中,为空间中的点坐标,为物体中心,为物体的最大高斯尺度,为机械爪的碰撞半径; S520:在工作空间内均匀采样多个种子点,对每个种子点邻域内的高斯原语集合提取表面法线信息; S530:通过主成分分析聚合法线,计算局部表面协方差矩阵: ; 其中为邻域内所有法线的平均值,为邻域内第j个法线向量,为邻域内的高斯原语的总数量; S540:基于特征分解协方差矩阵得到的局部稳定坐标系,利用GPG算法生成满足力学稳定性的候选抓取集合,并计算每个候选抓取的几何评分: ; 其中分别为左右接触点法线,为抓取方向,用于衡量接触法线与抓取方向的几何一致性; S500中基于自然语言指令的语义相关性对候选抓取进行重排序,最后通过几何与语义联合评分筛选出最终抓取姿态,具体包括: S550:对每个候选抓取,聚合其接触区域内高斯原语的语义特征,得到每个候选抓取的语义向量: ; 其中,为候选抓取接触区域内的高斯原语数量; S560:将用户自然语言指令通过CLIP文本编码器得到查询特征,计算语义相关性评分: ; S570:通过加权融合几何评分与语义评分得到最终评分: ; 其中为权重系数; S580:根据最终评分对所有候选抓取进行排序,选取前个候选作为最终抓取方案: ; 其中,为最终选择的抓取方案集合,为选择的抓取数量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。