联通沃悦读科技文化有限公司李勇刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉联通沃悦读科技文化有限公司申请的专利一种基于多模态的数据分类方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120804321B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511283796.0,技术领域涉及:G06F16/35;该发明授权一种基于多模态的数据分类方法、系统、设备及介质是由李勇刚;何玄;何熠;王振波设计研发完成,并于2025-09-09向国家知识产权局提交的专利申请。
本一种基于多模态的数据分类方法、系统、设备及介质在说明书摘要公布了:本申请实施例涉及一种基于多模态的数据分类方法、系统、设备及介质,本方法通过引入跨模态语义拓扑对齐机制,生成能够表征两个图结构对应节点之间的深层语义契合度的对齐向量,进而利用对齐向量确定图像模态和文本模态对应的可信度权重,最后根据第一可信度权重与第二可信度权重,融合图像特征和文本特征,利用融合特征实现目标电子书对应的分类结果。本方法通过深度解析图像与文本的语义图结构并进行拓扑对齐,创新性地依据对齐向量动态评估模态可信度并自适应加权融合,实现了超越图像的像素和文本的词汇级别的语义理解,提升了对目标电子书进行分类的准确性。
本发明授权一种基于多模态的数据分类方法、系统、设备及介质在权利要求书中公布了:1.一种基于多模态的数据分类方法,其特征在于,所述方法包括以下步骤: 响应目标电子书的分类信号,从所述目标电子书中提取出电子书文本和电子书图像;所述电子书图像包括所述目标电子书的封面图像、插图、章节页中的至少一种; 解析出所述电子书文本中的文本语义,得到文本语义图,并对所述电子书文本进行特征提取,得到文本特征; 解析出所述电子书图像中的图像语义,得到图像语义图,并对所述电子书图像进行特征提取,得到图像特征;其中,所述图像语义图中的图像节点为所述电子书图像中的物体、人物和场景中的至少一项,边为图像节点之间的关联关系; 确定所述文本语义图中的每一个文本节点的图嵌入特征与对应的所述图像语义图中的图像节点的图嵌入特征之间的第一一致性特征,以及确定所述图像语义图中的每一个图像节点的图嵌入特征与对应的所述文本语义图中的文本节点的图嵌入特征之间的第二一致性特征;并基于所述第一一致性特征和所述第二一致性特征生成表征文本语义和图像语义的语义一致性的对齐向量; 根据所述对齐向量,确定文本语义的第一可信度权重与图像语义的第二可信度权重,并根据所述第一可信度权重与所述第二可信度权重,融合所述文本特征和所述图像特征,以得到融合特征; 基于所述融合特征,确定所述目标电子书的类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人联通沃悦读科技文化有限公司,其通讯地址为:410011 湖南省长沙市长沙县黄花镇长沙临空经济示范区人民东路与小康路交汇处西南角房屋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励