北京智视数策科技发展有限公司田婧璇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智视数策科技发展有限公司申请的专利基于多模态特征的视频内容分类与风险预警方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120071228B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510556908.9,技术领域涉及:G06V20/40;该发明授权基于多模态特征的视频内容分类与风险预警方法及系统是由田婧璇;王金水设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。
本基于多模态特征的视频内容分类与风险预警方法及系统在说明书摘要公布了:本发明提供一种基于多模态特征的视频内容分类与风险预警方法及系统,涉及视频处理技术领域,包括通过提取视频帧中的运动目标位置与速度数据,生成运动轨迹图和加速度数据,识别冲突行为片段并生成其时空坐标;进一步提取音频中的方位角与俯仰角数据构建声源空间分布图,提取目标音频片段并获得声源位置数据,同时对文本数据进行语义分析得到文本特征分数;结合冲突片段与音频片段的时空重合度,生成行为‑声源一致性分数,并与文本特征分数融合计算风险判定分数,最终实现视频分类及高风险事件的自动预警。
本发明授权基于多模态特征的视频内容分类与风险预警方法及系统在权利要求书中公布了:1.基于多模态特征的视频内容分类与风险预警方法,其特征在于,包括: 获取待分类视频数据并进行解码得到视频帧数据、音频数据和文本数据; 提取视频帧数据中运动目标的位置数据和速度数据,基于位置数据生成运动轨迹图,基于速度数据计算运动加速度数据,结合运动轨迹图和运动加速度数据识别冲突行为片段,生成冲突行为片段的时空坐标数据; 提取音频数据中的方位角数据和俯仰角数据,构建声源空间分布图,从声源空间分布图中提取目标音频片段,生成目标音频片段的声源位置数据,同时对文本数据进行语义分析,生成文本特征分数; 基于时空坐标数据和声源位置数据计算冲突行为片段与目标音频片段的时空重合度分数,生成行为-声源一致性分数; 基于行为-声源一致性分数和文本特征分数生成风险判定分数和视频分类结果,当风险判定分数超过预设风险阈值时生成预警数据并发送至预设的远程监控终端,实现风险事件的及时预警响应; 基于时空坐标数据和声源位置数据计算冲突行为片段与目标音频片段的时空重合度分数,生成行为-声源一致性分数包括: 获取历史数据中行为位置与声源位置的对应关系,计算所述行为位置与所述声源位置之间的传播延迟时间,根据所述传播延迟时间对时空坐标数据和声源位置数据进行时序校正; 统计所述历史数据中的行为-声源距离分布和角度分布,构建空间权重矩阵,利用所述空间权重矩阵对时序校正后的时空坐标数据和声源位置数据进行空间校正; 在空间校正后的时空坐标数据和声源位置数据中提取冲突行为片段的行为轨迹和目标音频片段的声源轨迹,计算所述行为轨迹和声源轨迹的空间重合度,生成轨迹重合度得分; 对所述冲突行为片段和目标音频片段进行时间分段,在每个时间分段内计算行为位置和声源位置的空间距离,并获取对应的场景遮挡信息,基于所述空间距离和场景遮挡信息计算时间分段的时空匹配度,生成分段匹配度得分; 将所述轨迹重合度得分与分段匹配度得分进行加权融合,生成行为-声源一致性分数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智视数策科技发展有限公司,其通讯地址为:102200 北京市昌平区科技园区昌盛路12号院7号楼-1至4层101内201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励