西安电子科技大学;西安电子科技大学广州研究院乔晓田获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学;西安电子科技大学广州研究院申请的专利一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120070666B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510126918.9,技术领域涉及:G06T11/60;该发明授权一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质是由乔晓田;冯同辉;闫春生;夏小芳;崔江涛设计研发完成,并于2025-01-27向国家知识产权局提交的专利申请。
本一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质在说明书摘要公布了:一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质,方法包括:对场景文本图像训练集进行预处理,得到预处理后的场景文本布局生成训练集、场景文本图像生成训练集和场景文本图像生成测试集;构建背景图像生成模块、层次化布局生成模块和场景文本图像生成模块;构建完整的任意形状场景文本图像生成模型;分别对层次化布局生成模块和场景文本图像生成模块进行训练,得到训练后的层次化布局生成模块和场景文本图像生成模块的权重文件;模型推理,得到最终的场景文本图像;系统、设备及介质用于实现该方法;本发明能够不依赖用户输入布局,自动化的生成任意形状场景文本图像。
本发明授权一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质在权利要求书中公布了:1.一种层次布局驱动的任意形状场景文本图像生成方法,其特征在于,包括以下步骤: 步骤1,对场景文本图像训练集进行预处理,场景文本图像训练集包括场景文本布局生成训练集、场景文本图像生成训练集和场景文本图像生成测试集,最终得到预处理后的场景文本布局生成训练集、场景文本图像生成训练集和场景文本图像生成测试集;场景文本图像生成训练集包括文本提示词、无文本背景图像、字符层次布局内容以及场景文本图像; 步骤1.1,场景文本布局生成训练集包括无文本背景图像以及包含区域、语句与字符层次布局内容;将场景文本布局生成训练集中的无文本背景图像以及包含区域、语句与字符层次布局的内容,构成训练背景图像-层次布局对,其中,区域和语句层次布局由4个值构成,共2个控制点,分别表述布局的左上角与右下角的横纵坐标;字符层次布局由16个值构成,分别表述布局的顶部贝塞尔曲线4个控制点的横纵坐标与底部贝塞尔曲线4个控制点的横纵坐标; 步骤2,构建背景图像生成模块、层次化布局生成模块和场景文本图像生成模块; 步骤3,基于步骤2构建的背景图像生成模块、层次化布局生成模块和场景文本图像生成模块,构建完整的任意形状场景文本图像生成模型; 步骤4,使用步骤1中预处理后的场景文本布局生成训练集和场景文本图像生成训练集,分别对步骤2构建的层次化布局生成模块和场景文本图像生成模块进行训练,得到训练后的层次化布局生成模块和场景文本图像生成模块的权重文件; 步骤5,基于步骤1预处理后的场景文本图像生成测试集,利用步骤4训练后的层次化布局生成模块和场景文本图像生成模块的权重文件,通过步骤3构建的完整的任意形状场景文本图像生成模型并进行模型推理,得到最终的场景文本图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学;西安电子科技大学广州研究院,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励