北京邮电大学徐士彪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利基于三维场景与语言数据联合的数据增强方法、装置及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120671074B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510751059.2,技术领域涉及:G06F18/25;该发明授权基于三维场景与语言数据联合的数据增强方法、装置及系统是由徐士彪;许镕涛;王常维;高涵设计研发完成,并于2025-06-06向国家知识产权局提交的专利申请。
本基于三维场景与语言数据联合的数据增强方法、装置及系统在说明书摘要公布了:本申请提供了一种基于三维场景与语言数据联合的数据增强方法、装置及系统,方法包括:获取3D场景数据以及对应的文本标注数据;分别对场景数据和文本标注数据进行预处理,得到预处理后的3D‑语言联合数据;对预处理后的3D‑语言联合数据依次进行多模态数据增强,语义质量过滤处理,得到目标3D‑语言联合数据集。本申请通过整合3D点云数据、RGB‑D图像、问答对和密集描述等多种数据源,利用数据预处理、多模态数据增强和语义质量过滤,实现高质量大规模数据集的自动构建,能够在提高3D场景理解和视觉问答任务的数据质量的同时,增强数据的多样性和泛化能力,为3D视觉理解、机器人任务规划等应用提供有力支持。
本发明授权基于三维场景与语言数据联合的数据增强方法、装置及系统在权利要求书中公布了:1.一种基于三维场景与语言数据联合的数据增强方法,其特征在于,所述方法包括: 获取3D场景数据以及对应的文本标注数据;所述3D场景数据包括:场景点云数据、RGB‑D图像及相机位姿信息;所述文本标注数据包括:与场景对象位置、属性及关系相关的问答对和密集描述信息; 分别对所述3D场景数据和所述文本标注数据进行预处理,得到预处理后的3D‑语言联合数据;所述预处理包括:对场景点云数据的归一化处理、对所述RGB‑D图像的一致性处理,以及对所述文本标注数据的数据清洗处理和语法结构分析处理; 对所述预处理后的3D‑语言联合数据进行多模态数据增强,得到增强联合数据;所述多模态数据增强包括:对所述RGB‑D图像的旋转、平移和尺度变换多种图像扩充操作,以及对所述问答对和密集描述信息的同义词替换、逻辑反转、模板化生成三种策略的数据扩充操作; 对所述增强联合数据进行语义质量过滤处理,得到目标3D‑语言联合数据集; 所述方法还包括: 对所述目标3D‑语言联合数据集中的文本数据、视觉提示数据和三维点云数据分别进行编码,得到三种数据分别对应的编码特征,包括:基于Transformer架构对文本数据进行编码,生成高维表示特征;通过多层感知机对视觉提示数据进行展平和线性映射,得到视觉提示数据的空间先验嵌入特征;采用Vote2Cap‑DETR++网络对三维点云数据进行特征提取,得到三维点云数据的深层几何特征; 对三种数据分别对应的编码特征进行融合,得到融合特征,包括:采用拼接方式对视觉提示数据对应的空间先验嵌入特征与三维点云数据对应的深层几何特征进行初步融合,得到联合特征;通过跨模态注意力机制对所述文本数据对应的高维表示特征与所述联合特征进行深度融合,得到交互特征;对所述交互特征与所述文本数据对应的高维表示特征进行自注意力处理,并通过残差连接进行特征叠加,形成融合特征; 将所述融合特征输入到预训练的大规模语言模型中进行自然语言解码,得到目标自然语言。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100089 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励