厦门大学张国栋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种基于文本分割的场景文本放大方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116071464B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310143739.7,技术领域涉及:G06T11/60;该发明授权一种基于文本分割的场景文本放大方法是由张国栋;林文水;王亦楷;胡鹏设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。
本一种基于文本分割的场景文本放大方法在说明书摘要公布了:一种基于文本分割的场景文本放大方法,属于图像的文本处理的技术领域。包括步骤:S1:文本分割,将文本从给定的场景图像中分割并提取出来,得到文本图像和文本位置信息;S2:场景文本擦除,从给定的场景图像中擦除指定的场景文本,作为场景背景图像;S3:文本放大,利用步骤S1中得到的文本图像和文本位置信息,指定想要放大的文本,保持相对位置不变,经过一定比例的放大,得到放大的文本图像;S4:图像融合,即将放大的文本图像按一定规则嵌入到场景背景图像中,得到输出图像。在不影响背景的情况下有效地放大场景中指定的文本,能够帮助有近视或阅读障碍的特殊群体更好地了解场景,可用于增强现实等应用。
本发明授权一种基于文本分割的场景文本放大方法在权利要求书中公布了:1.一种基于文本分割的场景文本放大方法,其特征在于包括如下步骤: S1:文本分割,将文本从给定的场景图像中分割并提取出来,得到文本图像和文本位置信息; 将文本从给定的场景图像中分割并提取出来,得到文本图像和文本位置信息,具体包括三个模块:注意力文本检测模块、基于Resnet101的DeeplabV3+文本分割模块、文本抠图模块; 所述注意力文本检测模块:用于将可能包含文本的区域突出显示出来; 所述基于Resnet101的DeeplabV3+文本分割模块:用于从输入图像中提取文本区域文字特征,得到文本和背景的二值化图像及文本位置信息; 所述文本抠图模块:用于将网络之前得到的二值化图像,提取出文本像素,过滤掉背景部分,得到文本图像; 所述分割的Loss为Lsem,如下所示: Lsem=Lsem1+αLout+βLtri1 其中,输入图像为x,经过DeeplabV3+主干网提取特征,并且经过激活函数得到的预测的分割图xsem1,与真实分割图xgt的交叉熵损失如下: Lsem1=CrossEntropyxsem1,xgt2 另外,通过增强得到的预测分割图为xout,与真实分割图xgt的交叉熵损失如下: Lout=CrossEntropyxout,xgt3 文字的边界对分割的效果非常重要,Ltri表示用文字边界来做一个加权的交叉熵损失,其中wtri为图片中文字边界区域的二进制映射值;WCE操作是以w为权重的x和y之间的交叉嫡损失; Ltri=WCExout,xgt,wtri4 S2:场景文本擦除,从给定的场景图像中擦除指定的场景文本,作为场景背景图像; S3:文本放大,利用S1步骤中得到的文本图像和文本位置信息,指定想要放大的文本,保持相对位置不变,经过一定比例的放大,得到放大的文本图像; S4:图像融合,即将放大的文本图像按一定规则嵌入到场景背景图像中,得到输出图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明区思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励