特赞(上海)信息科技有限公司范凌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉特赞(上海)信息科技有限公司申请的专利视频数据的处理方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116453013B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310280204.4,技术领域涉及:G06V20/40;该发明授权视频数据的处理方法及设备是由范凌;梁天明设计研发完成,并于2023-03-21向国家知识产权局提交的专利申请。
本视频数据的处理方法及设备在说明书摘要公布了:本公开的实施例提供一种视频数据的处理方法及设备,涉及计算机技术领域,解决了当前人工验收视频带来的错误率比较大的问题。所述方法包括:获取投放的视频数据,所述视频数据包括口播数据和画面数据;通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本;通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本;根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果。本公开实施例适用于品牌方针对所投放视频的验收过程。
本发明授权视频数据的处理方法及设备在权利要求书中公布了:1.一种视频数据的处理方法,其特征在于,所述方法包括: 获取投放的视频数据,所述视频数据包括口播数据和画面数据; 通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本; 通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本; 根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果, 所述方法还包括: 将所述画面数据逐帧提取,通过ocr接口得到所有帧画面的ocr文本; 根据预设文本去重规则以及DBscan聚类算法,将所有帧画面的ocr文本进行去重处理,得到第一次清洗后的ocr文本; 通过asr接口,得到所述口播数据对应的asr文本; 利用信息熵和指定阈值,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果; 利用TF-IDF算法与指定词性,对所述asr分词结果与所述ocr分词结果进行过滤,得到asr新词包与ocr新词包, 其中,所述利用信息熵和指定阈值,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果包括: 分别计算所述asr文本与所述第一次清洗后的ocr文本中,每相邻两个字之间的信息熵; 利用所述指定阈值筛选所述信息熵,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果; 其中,所述利用TF-IDF算法与指定词性,对所述asr分词结果与所述ocr分词结果进行过滤,得到asr新词包与ocr新词包包括: 利用TF-IDF算法,计算所述asr分词结果与所述ocr分词结果中的词语的分值,并按照所述分值进行排序,得到重要性由高到低进行排序的asr分词与ocr分词; 利用所述指定词性,筛选所述asr分词与所述ocr分词,得到所述asr新词包与所述ocr新词包。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人特赞(上海)信息科技有限公司,其通讯地址为:200000 上海市浦东新区中国(上海)自由贸易试验区张衡路200号2幢3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励