广州信安数据有限公司高伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州信安数据有限公司申请的专利一种基于深度学习的多模态数据质量评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120804084B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511299320.6,技术领域涉及:G06F16/215;该发明授权一种基于深度学习的多模态数据质量评估方法是由高伟;王全胜;邓水平;周小敏设计研发完成,并于2025-09-12向国家知识产权局提交的专利申请。
本一种基于深度学习的多模态数据质量评估方法在说明书摘要公布了:本发明公开了一种基于深度学习的多模态数据质量评估方法,包括获取数据库中被标记为对齐的第一模态记录数据和第二模态记录数据;对第一模态记录数据和第二模态记录数据分别进行语义特征提取以得到文本结构化数据语义编码特征张量和元数据描述语义编码特征向量;对文本结构化数据语义编码特征张量和元数据描述语义编码特征向量跨模态联合编码以得到结构化‑元数据跨模态质量评估联合编码特征张量;基于结构化‑元数据跨模态质量评估联合编码特征张量生成重构记录数据,计算重构记录数据的偏移特征;通过第一深度学习模型对偏移特征进行质量评估;本发明通过语义编码特征提取、细粒度哈希跨模态编码与双向重构偏移评估,提高数据质量评估的精准性。
本发明授权一种基于深度学习的多模态数据质量评估方法在权利要求书中公布了:1.一种基于深度学习的多模态数据质量评估方法,其特征在于,包括以下步骤: 利用采集引擎获取数据库中被标记为对齐的第一模态记录数据和第二模态记录数据,其中,所述第一模态记录数据为结构化关系表,所述第二模态记录数据为关联元数据描述; 对所述第一模态记录数据和所述第二模态记录数据分别进行语义特征提取以得到文本结构化数据语义编码特征张量和元数据描述语义编码特征向量; 对所述文本结构化数据语义编码特征张量和所述元数据描述语义编码特征向量进行跨模态联合编码以得到结构化-元数据跨模态质量评估联合编码特征张量; 基于所述结构化-元数据跨模态质量评估联合编码特征张量进行数据重构以得到重构记录数据; 计算所述重构记录数据与所述第一模态记录数据之间的数据一致性偏移量,生成第一偏移特征;计算所述重构记录数据与所述第二模态记录数据之间的数据一致性偏移量,生成第二偏移特征;通过预设的第一深度学习模型对第一偏移特征和第二偏移特征进行质量评估,输出多模态数据质量评估结果; 其中,所述跨模态联合编码包括: 对所述文本结构化数据语义编码特征张量进行沿通道维度的局部特征分解以得到文本局部语义特征矩阵的集合; 定义所述元数据描述语义编码特征向量作为统一查询向量,并将所述文本局部语义特征矩阵的集合中的每个矩阵作为独立的数据库键值矩阵; 针对每个数据库键值矩阵,执行细粒度数据库属性哈希算法查询编码操作,将统一查询向量与当前键值矩阵进行匹配计算,生成对应的结构化-元数据文本描述局部哈希查询编码向量; 汇集所有数据库键值矩阵的处理结果,形成结构化-元数据文本描述局部哈希查询编码向量的完整集合; 以所述局部哈希查询编码向量的完整集合作为描述信息,对所述文本结构化数据语义编码特征张量进行特征抽取以生成所述结构化-元数据跨模态质量评估联合编码特征张量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州信安数据有限公司,其通讯地址为:511457 广东省广州市南沙区南沙街进港大道8号2301房A74;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励