Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学侯辰舒获国家专利权

浙江大学侯辰舒获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利一种基于自适应位置编码和并行解码的3D视觉定位方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119399443B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411537179.4,技术领域涉及:G06V10/25;该发明授权一种基于自适应位置编码和并行解码的3D视觉定位方法及系统是由侯辰舒;王闻箫;何晓飞;蔡登设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。

一种基于自适应位置编码和并行解码的3D视觉定位方法及系统在说明书摘要公布了:本发明公开了一种基于自适应位置编码和并行解码的3D视觉定位方法及系统,其中方法包括:使用文本编码器处理输入的自然语言文本,得到文本令牌和特征;使用视觉编码器处理3D点云输入,得到种子点和特征;采用交叉编码器对视觉和文本特征进行互调,更新文本特征和视觉特征;预测种子点的置信度分数并排序,选出分数最高的候选点作为查询;根据自然语言描述的语义将文本令牌分为目标物体属性令牌和周围空间环境令牌;使用双分支并行解码器,生成新的查询特征,并由框预测头生成粗预测框;将生成的查询特征投影到位置特征和对象语义特征中,用于计算损失并训练网络;使用查询特征的投影结果为粗预测框评分,取分数最高者为视觉定位结果。

本发明授权一种基于自适应位置编码和并行解码的3D视觉定位方法及系统在权利要求书中公布了:1.一种基于自适应位置编码和并行解码的3D视觉定位方法,其特征在于,包括如下步骤: 1使用预训练的RoBERTa模型作为文本编码器处理输入的自然语言文本,得到L个文本令牌和对应的特征D为特征维度; 2使用PointNet++作为视觉编码器处理输入的3D点云特征,采样得到N个种子点和对应的特征 3采用BUTD-DETR的交叉编码器模块对视觉和文本特征进行互调,得到文本令牌的文本特征和种子点的视觉特征 4预测N个种子点的置信度分数并排序,从中选出分数最高的前K个候选点作为查询,其特征为 5根据自然语言描述的语义将L个文本令牌分为Lm个目标物体属性令牌和LS个周围空间环境令牌,其特征分别为和 6解码器共N层,在每层中,查询首先通过自注意层,其输出将作为后续每个交叉注意层的查询;解码器具有两个并行分支,一个用于提取目标物体的属性特征,称为目标对象分支,另一个用于感知每个查询周围的空间环境,称为空间环境分支;种子点的视觉特征在两个分支中都充当视觉交叉注意层的键和值,步骤5中生成的目标物体令牌和空间环境令牌的特征Tm和Ts分别作为两个分支中文本交叉注意层的键和值;最后,先将每个分支中视觉引导的特征和文本引导的特征融合在一起,然后融合来自两个分支的特征,其输出成为新的查询特征,并由框预测头生成粗预测框; 7将解码器每层中的查询特征投影到位置特征和对象语义特征中,二者和步骤6中的粗预测框都用于计算损失并训练网络; 8使用步骤7最后一层查询特征的投影结果为步骤6最后一层解码器的粗预测框评分,取分数最高者为视觉定位结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。