深圳市标准技术研究院刘杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市标准技术研究院申请的专利结合文字视觉特征和文字内容特征的违规广告识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114155529B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111303591.6,技术领域涉及:G06V30/148;该发明授权结合文字视觉特征和文字内容特征的违规广告识别方法是由刘杨;路宏峰;张浩;曾振威;雷道宇设计研发完成,并于2021-11-05向国家知识产权局提交的专利申请。
本结合文字视觉特征和文字内容特征的违规广告识别方法在说明书摘要公布了:本发明涉及计算机技术,具体涉及结合文字视觉特征和文字内容特征的违规广告识别方法,分别利用三种方式将彩色图像转化为文字视觉图像本身特征、文字视觉图像的笔画特征和图片文字识别转换为文本特征三种特征;利用vgg16抽取图像本身特征;利用RAN抽取汉字的笔顺特征;采用CNN‑encoderDecoder架构抽取汉字的笔画特征后和图像本身特征嵌入转化融合;利用DenseNet进行特征学习分类;利用OCR对图像文字部分转化为文本信息;对文本信息进行规则匹配审核;应用RoFormer的神经网络模型对句子粒度的文本信息进行特征学习分裂;识别违规广告结果。该方法可为各大网站平台的广告审核监管系统提供有力支持。
本发明授权结合文字视觉特征和文字内容特征的违规广告识别方法在权利要求书中公布了:1.结合文字视觉特征和文字内容特征的违规广告识别方法,其特征在于:包括以下步骤: 步骤1、输入格式多样含有视觉化文字的待检测广告图片,并进行降噪、图像裁剪等图像预处理步骤; 步骤2、将图片中视觉化的文字转化为三种不同特征的向量输入,分别是文字视觉图像本身特征、文字视觉图像的笔画信息特征和图片文字识别转换为文本特征; 步骤3、构建基于神经网络的特征分类器,将图像本身特征和笔画信息特征进行嵌入融合后进行特征分类;步骤3的实现包括结合图像本身的特征和视觉文字的笔顺信息转化为嵌入表示,通过DenseNet神经网络进行特征学习分类,具体过程包括: 步骤3.1、输入待识别图片,利用vgg16神经网络抽取图像本身特征; 步骤3.2、使用RAN部件分析网络根据十大汉字常用空间结构对具有视觉效果的文字的空间架构和偏旁部件进行分析,抽取汉字的笔顺特征信息; 步骤3.3、将图像本身特征和笔顺特征转化成嵌入表示后进行concat向量拼接,通过DenseNet神经网络进行特征分类学习,识别图片中视觉化文字是否含有违规部分; 步骤4、构建基于规则匹配和神经网络的文本审核系统对文字识别转换后的文本特征进行审核,判断是否含有恶意推广的违规广告内容;步骤4的实现包括利用OCR技术提取图像中的文本特征,然后利用规则匹配的方式审核文本是否含有电商平台链接恶意推广内容,再利用基于深度学习网络RoFormer的分类模型对文本特征进行分类;具体过程包括: 步骤4.1、利用OCR技术提取待检测图片中文本内容; 步骤4.2、采用正则表达式匹配的方式对文本内容进行恶意推广的匹配审核,包括QQ号、微信号、手机号、平台外链的恶意推广内容的审核; 步骤4.3构建RoFormer深度学习模型,将文本内容以句子或段落为粒度直接输入模型进行特征提取分类,识别出包含违规广告的信息; 步骤5、结合分类器和审核结果,判断待测广告图片是否含有违规广告信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市标准技术研究院,其通讯地址为:518000 广东省深圳市彩田路2038号海天综合大厦13-16楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。