广州云趣信息科技有限公司邓从健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州云趣信息科技有限公司申请的专利一种跨模态语义解析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120408537B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510908081.3,技术领域涉及:G06F18/25;该发明授权一种跨模态语义解析方法是由邓从健;汤冬儿;许志远;朱志华;史鹏;刘毅;吴远军;王灿武设计研发完成,并于2025-07-02向国家知识产权局提交的专利申请。
本一种跨模态语义解析方法在说明书摘要公布了:本申请提供了一种跨模态语义解析方法,涉及数据处理技术领域,所述方法包括:调取视觉模态解析策略对源视频进行解析,得到视觉解析信息;调取听觉模态解析策略对源音频进行解析,得到听觉解析信息;对视觉解析信息与听觉解析信息进行阶段性对比分析;若情感对比结果达到预定对比约束,则分析得到实时模态权重分配;获取文字解析信息,并结合实时模态权重分配对文字解析信息、视觉解析信息和听觉解析信息进行融合,得到语义解析结果。通过本申请解决了现有技术中由于各模态间的信息结构、表达方式差异较大,导致语义解析准确率低的技术问题,通过结合视觉、听觉和文字模态的语义解析方法,提高了跨模态语义解析的准确性和适应性。
本发明授权一种跨模态语义解析方法在权利要求书中公布了:1.一种跨模态语义解析方法,其特征在于,包括: 调取视觉模态解析策略对源视频进行解析,得到视觉解析信息; 调取听觉模态解析策略对从所述源视频中提取到的源音频进行解析,得到听觉解析信息; 对所述视觉解析信息与所述听觉解析信息进行阶段性对比分析,得到情感对比结果; 若所述情感对比结果达到预定对比约束,则分析模态解析数据库得到实时模态权重分配; 获取源文字的文字解析信息,并结合所述实时模态权重分配对所述文字解析信息、所述视觉解析信息和所述听觉解析信息进行融合,得到语义解析结果; 调取视觉模态解析策略对源视频进行解析,得到视觉解析信息,包括: 对所述源视频进行动态图像压缩处理得到压缩视频; 根据所述视觉模态解析策略中的镜头检测机制对所述压缩视频进行检测分析,得到检测结果; 提取所述检测结果中第一镜头对应的第一图像序列,并对所述第一图像序列进行增强融合处理,得到第一目标图像; 根据所述视觉模态解析策略中的情感解析机制对所述第一目标图像进行情感解析,得到第一情感信息; 在所述源视频中匹配所述第一镜头对应的第一视频片段,并基于所述第一视频片段与所述第一情感信息的第一映射关系,组建所述视觉解析信息; 调取听觉模态解析策略对从所述源视频中提取到的源音频进行解析,得到听觉解析信息,包括: 获取所述源音频的声音信号,并分析所述声音信号得到声音强度时序; 对所述声音强度时序进行随机分割得到分割结果; 收集所述分割结果中第一时序的第一时域特征参数; 收集快速傅里叶变换处理所述第一时序得到的第一频谱的第一频域特征参数; 激活所述听觉模态解析策略中的声音情感预测模型对所述第一时域特征参数与所述第一频域特征参数进行预测分析,得到第一预测情感信息; 在所述源音频中匹配所述第一时序对应的第一音频片段,并基于所述第一音频片段与所述第一预测情感信息的第二映射关系,组建所述听觉解析信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州云趣信息科技有限公司,其通讯地址为:510000 广东省广州市天河区建工路4号佳都科技大厦2号楼六楼603-610;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励