华南理工大学梁凌宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于轮廓建模的自然场景视频文本检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116092069B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310058072.0,技术领域涉及:G06V20/62;该发明授权一种基于轮廓建模的自然场景视频文本检测方法及系统是由梁凌宇;肖沃城设计研发完成,并于2023-01-17向国家知识产权局提交的专利申请。
本一种基于轮廓建模的自然场景视频文本检测方法及系统在说明书摘要公布了:本发明公开了一种基于轮廓建模的自然场景视频文本检测方法及系统,包括视频帧读取与初始化,提取图像帧信息、文本区域信息预测,帧间文本信息融合、GPU加速后处理及视频帧追踪,所述帧间文本信息融合是设定两个大小不同的阈值对相邻两帧预测的文本信息进行融合筛选得到增强后的文本信息。本方法使用傅里叶帧间融合建模文本轮廓,辅以匹配算法对文本目标进行追踪,同时使用GPU加速推理,在保证了较高水准的检测准确率的情况下能够实现对视频文本的实时检测。
本发明授权一种基于轮廓建模的自然场景视频文本检测方法及系统在权利要求书中公布了:1.一种基于轮廓建模的自然场景视频文本检测方法,其特征在于,包括: 视频帧读取与初始化:具体是对读取的视频帧进行尺度变换,并进行归一化操作得到输入图像帧; 提取图像帧信息:使用深度为50的ResNet网络提取输入图像帧的图像帧信息,并利用特征金字塔网络获得图像帧的多尺度信息; 文本区域信息预测:根据多尺度信息,预测相应尺度的文本轮廓置信度图与各像素点对应文本的傅里叶级数; 帧间文本信息融合:设定两个大小不同的阈值对相邻两帧预测的文本信息进行融合筛选得到增强后的文本信息,具体为: 设定两个大小不同的阈值β1、β2; 先对前一帧的文本轮廓置信度图clst-1与阈值β1进行比较,筛选大于β1的部分得到前帧有用的补充信息clst-1′,随后将筛选后的clst-1′和当前帧的文本轮廓置信度图clst融合以加强当前帧的预测效果,得到的融合文本信息图再使用阈值β2进行比较,得到大于阈值β2的有效部分作为最后的结果; GPU加速后处理:在GPU上进行加速,通过傅里叶反变换建模文本轮廓,使用非极大值抑制筛除冗余的文本,得到最终的文本检测结果; 视频帧追踪:对相邻帧的文本检测结果,通过IOU值构建IOU矩阵,通过KM算法和匈牙利算法进行匹配追踪; 所述视频帧追踪,具体为: 对于相邻图像帧中所预测的文本轮廓,使用匹配算法对其追踪,对前一时刻t-1图像帧中的轮廓和当前时刻t图像帧中的轮廓,两两计算IOU值构建IOU矩阵,通过IOU矩阵,使用KM算法进行匹配,如匹配成功,则该文本轮廓的追踪状态更新;若匹配失败,查看追踪状态,若达到最大追踪时长,将该文本轮廓删除,若未达到最大追踪时长,则保留该文本轮廓,更新该文本的追踪时长。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。