中国电子科技集团有限公司电子科学研究院;中电科电科院科技集团有限公司刘晨羽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团有限公司电子科学研究院;中电科电科院科技集团有限公司申请的专利基于变体词识别的直播违规行为检测方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118967153B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410979366.1,技术领域涉及:G06Q30/018;该发明授权基于变体词识别的直播违规行为检测方法、装置及设备是由刘晨羽;欧阳小叶;白然;谷晓鹏;吕东岳;周彦果;闫红艳;袁柳设计研发完成,并于2024-07-22向国家知识产权局提交的专利申请。
本基于变体词识别的直播违规行为检测方法、装置及设备在说明书摘要公布了:本发明提出了一种基于变体词识别的直播违规行为检测方法,包括:基于语音识别模型和光学字符识别模型,获取直播间的音频和视觉文字,并转化为文本数据;提取文本数据,并进行多层级变体词识别,包括:基于正则匹配的变体词识别、基于统计语言模型的变体词识别和基于大语言模型的变体词识别;基于识别到的变体词,获取变体词的原词,并将原词与敏感词库进行匹配,判断原词是否存在;如果原词存在,则调取变体词前后设定时长的视频数据,并保存为违规证据。本申请采取不同的识别检测方法来应对不同类型的变体词,在不同时间粒度采用不同精细度的变体词识别方法,实现了直播违规行为检测技术中实时性与准确性的平衡。
本发明授权基于变体词识别的直播违规行为检测方法、装置及设备在权利要求书中公布了:1.基于变体词识别的直播违规行为检测方法,其特征在于,包括: 基于语音识别模型和光学字符识别模型,获取直播间的音频和视觉文字,并转化为文本数据; 提取所述文本数据,并进行多层级变体词识别; 基于识别到的变体词,获取所述变体词的原词,并将所述原词与预先构造的敏感词库进行匹配,判断所述原词是否存在于所述敏感词库中; 如果所述原词存在于所述敏感词库中,则调取所述变体词前后设定时长的视频数据,并保存为违规证据; 其中,所述多层级变体词识别,包括:基于正则匹配的变体词识别、基于统计语言模型的变体词识别和基于大语言模型的变体词识别; 所述多层级变体词识别配置有时间优先级分级过滤策略,即: 在直播视频内容实时流中,所述基于正则匹配的变体词识别的时间优先级大于所述基于统计语言模型的变体词识别的时间优先级,所述基于统计语言模型的变体词识别的时间优先级大于所述基于大语言模型的变体词识别的时间优先级; 所述多层级变体词识别启动后,所述基于正则匹配的变体词识别进行反馈; 每经过设定的第一时段后,所述基于统计语言模型的变体词识别对前一所述第一时段的数据进行识别并反馈; 每经过设定的第二时段后,所述基于大语言模型的变体词识别对前一所述第二时段的数据进行识别并反馈。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团有限公司电子科学研究院;中电科电科院科技集团有限公司,其通讯地址为:100041 北京市石景山区双园路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。