小语智能信息科技(云南)有限公司毛存礼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉小语智能信息科技(云南)有限公司申请的专利融合门控注意力的缅甸语文本图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118864659B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410826376.1,技术领域涉及:G06T11/60;该发明授权融合门控注意力的缅甸语文本图像生成方法是由毛存礼;高盛祥;黄于欣;陈蕊;王琳钦;王奉孝设计研发完成,并于2024-06-25向国家知识产权局提交的专利申请。
本融合门控注意力的缅甸语文本图像生成方法在说明书摘要公布了:本发明涉及融合门控注意力的缅甸语文本图像生成方法,属于自然语言处理领域。为了解决传统文本图像合成算法合成的缅甸语图像与真实应用场景存在较大差距造成训练的识别模型性能不佳的问题,提出一种融合门控注意力的缅甸语文本图像生成方法,主要包括缅甸语图像数据集构建及预处理、缅甸语文本渲染模块、融合门控注意力的缅甸语图像文本图像生成三部分构成。本发明相比通用的图像文本生成方法本发明有效地合成较高质量的文本图像,使生成的缅甸语文本图像更接近真实场景的文本图像。
本发明授权融合门控注意力的缅甸语文本图像生成方法在权利要求书中公布了:1.融合门控注意力的缅甸语文本图像生成方法,其特征在于:所述方法的具体步骤如下: Step1、缅甸语图像数据集构建及预处理:结合缅甸语的字符组合特征构造缅甸语文本图像数据集;构建的缅甸语文本图像数据集包含源图像、目标文本在灰色背景图呈现的图像、目标文本的骨架化图像、源图像的背景图像、目标文本在源图像背景图像上的源文本样式渲染效果图、目标文本灰度图像的二进制掩码以及目标文本在灰色背景图上源文本样式渲染效果图,这些图像数据作为模型网络的训练数据; Step2、通过缅甸语文本渲染模块将源图像Is和目标文本在源图像背景图像上的源文本样式渲染效果图It作为输入,目的是从源图像Is中提取前景风格,具体包括字体、颜色、几何变形;文本渲染模块输出含有目标文本的语义图像Ot和源图像的文本风格的图像Osk; Step3、通过背景提前网络将源图像中所有文本笔划像素擦除并用适当的纹理填充;为了更好地辅助提取缅甸语图像文本样式和背景,提出融合门控注意力的图片擦除方法,减少背景噪声的干扰,使得模型能更好地区分文本笔划区域的纹理和背景图像,以便更精确地从输入图像中提取出背景部分;最后将提取到的背景图像与文本渲染模块得到的目标文本以及源图像文本风格进行融合得到编辑后的缅甸语图像; 门控注意力模块以特征提取网络提取的特征图作为输入,通过计算输入图像和真实标签图像之间的像素值差异来生成伪文本笔划掩码,分别生成文本笔划区域特征图和文本笔画周围区域特征图,文本笔划区域特征图有助于加强门控注意力模块对图像文本区域的关注,文本笔画周围区域特征图则是通过对文本区域外的颜色和纹理进行集中训练,帮助更好地区分文本区域范围;同时,门控注意力模块通过Gate参数调整,从而在训练过程中调整分配给文本笔划区域特征图和文本笔画周围区域特征图的注意力比例。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人小语智能信息科技(云南)有限公司,其通讯地址为:650500 云南省昆明市呈贡区科技信息产业创新孵化中心A座研发办公楼7楼704号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。