语联网(武汉)信息技术有限公司陈斯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉语联网(武汉)信息技术有限公司申请的专利多模态数据的分类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116049518B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111254740.4,技术领域涉及:G06F16/906;该发明授权多模态数据的分类方法及装置是由陈斯设计研发完成,并于2021-10-27向国家知识产权局提交的专利申请。
本多模态数据的分类方法及装置在说明书摘要公布了:本发明提供一种多模态数据的分类方法及装置,其中,该方法包括:基于待分类多模态数据的类型,对于待分类多模态数据中每一目标对象,生成携带有目标对象的位置信息的第一矩阵;基于第一矩阵和目标对象的特征向量,获取第一向量;将各第一向量输入分类模型,获取待分类多模态数据的分类结果;其中,待分类多模态数据的类型包括文本、音频、图片或视频;第一矩阵为旋转矩阵。本发明提供的多模态数据的分类方法及装置,通过旋转矩阵携带目标对象的位置信息的方式,进行位置嵌入,基于多模态数据的类型,选择更强档的位置信息编码和嵌入的方式,能降低计算的复杂性,不会分散位置信息,能提高分类模型的性能,能提高多模态数据分类的效率和准确率。
本发明授权多模态数据的分类方法及装置在权利要求书中公布了:1.一种多模态数据的分类方法,其特征在于,包括: 基于待分类多模态数据的类型,对于所述待分类多模态数据中每一目标对象,生成携带有所述目标对象的位置信息的第一矩阵; 基于所述第一矩阵和所述目标对象的特征向量,获取第一向量; 将各所述第一向量输入分类模型,获取所述待分类多模态数据的分类结果; 其中,所述待分类多模态数据的类型包括文本、音频、图片或视频;所述第一矩阵为旋转矩阵; 所述基于待分类多模态数据的类型,对于所述待分类多模态数据中每一目标对象,生成携带有所述目标对象的位置信息的第一矩阵,具体包括: 根据所述目标对象的位置信息和三角函数,生成第一维数的所述第一矩阵;其中,所述第一维数是根据所述待分类多模态数据的类型确定的; 所述根据所述目标对象的位置信息和三角函数,生成所述第一矩阵,具体包括: 在所述待分类多模态数据的类型为视频的情况下,根据如下公式生成所述第一矩阵 ; 其中,表示目标对象的空间位置信息;k表示目标对象的时间位置信息;Rm,n,k表示第一矩阵;θ表示基准角度;。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语联网(武汉)信息技术有限公司,其通讯地址为:430206 湖北省武汉市江夏区东湖高新技术开发区高新大道999号武汉未来科技城B区B2栋B座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。