恭喜中邮科通信技术股份有限公司陈晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中邮科通信技术股份有限公司申请的专利一种基于LLM的视频多模态检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120071225B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510550460.X,技术领域涉及:G06V20/40;该发明授权一种基于LLM的视频多模态检测方法及系统是由陈晨;胡煜宏;吴芳;杨岑达;方铀;郑松森;梁镇;饶可煌;刘振华设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。
本一种基于LLM的视频多模态检测方法及系统在说明书摘要公布了:本发明涉及计算机视觉和多模态内容分析技术领域,公开了一种基于LLM的视频多模态检测方法及系统,其中,一种基于LLM的视频多模态检测方法包括:通过多层次神经网络将视频中的视觉、音频和文字信息投影至统一语义空间,计算模态间一致性得分以定位潜在冲突点,提取文化背景信息计算表达内容与文化预期间的偏差值,通过层级化特征提取识别非字面表达,识别视频中的不同叙述视角并评估对一致性判断的影响,最后对不同类型冲突采取差异化处理策略;本发明解决了传统多模态分析中忽视模态冲突、对跨文化表达理解不足及视角差异造成的误判问题,提升了视频内容检测的准确性和跨文化理解能力。
本发明授权一种基于LLM的视频多模态检测方法及系统在权利要求书中公布了:1.一种基于LLM的视频多模态检测方法,其特征在于,包括以下步骤: 从视频中提取视觉、音频和文字信息,通过多层次神经网络将不同模态信息投影至统一的语义空间,生成统一表示向量; 基于统一表示向量,计算不同模态信息之间的语义一致性得分,量化不一致程度,定位潜在冲突点,构建模态一致性时序图谱; 其中,计算不同模态信息之间的语义一致性得分的步骤包括: 使用加权余弦相似度计算不同模态表示向量间的语义一致性; 通过自适应阈值函数动态调整一致性判定标准; 对检测到的冲突点进行时空聚类分析,合并时间和语义上相近的冲突点; 基于模态一致性时序图谱和视频内容提取文化背景信息,计算表达内容与文化预期之间的偏差值作为反讽识别特征; 利用反讽识别特征,通过层级化特征提取和多模态交叉验证识别视频中的非字面表达,包括:构建三层级特征提取系统,从表层特征、上下文特征到深层语义特征逐级分析; 通过语言视觉、语言音频交叉验证和三模态整合验证,提高识别准确性;利用预训练大型语言模型进行深层语义理解和反事实推理; 基于非字面表达识别结果,识别视频内容中的不同叙述视角,评估视角对模态一致性判断的影响; 根据模态一致性得分、非字面表达识别结果和视角差异评估,针对识别出的不同类型冲突采取差异化处理策略,输出包含模态关系解析和非字面表达理解的检测结果; 在统一的语义空间中进行跨模态语义对齐,确保相同语义内容在不同模态下的表示向量具有高相似度,同时保留模态间表面不一致但语义相关的特性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中邮科通信技术股份有限公司,其通讯地址为:350007 福建省福州市仓山区六一南路241-1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。