中电信人工智能科技(北京)有限公司方瀚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信人工智能科技(北京)有限公司申请的专利图像生成方法、模型训练方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540379B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411448248.4,技术领域涉及:G06T11/00;该发明授权图像生成方法、模型训练方法、装置、设备及存储介质是由方瀚;冯泽润;张华宇;班超;孙皓设计研发完成,并于2024-10-16向国家知识产权局提交的专利申请。
本图像生成方法、模型训练方法、装置、设备及存储介质在说明书摘要公布了:本申请实施例公开了一种图像生成方法、模型训练方法、装置、设备及存储介质,该图像生成方法包括:在接收到待生成图像的描述文本时,随机生成噪声图像;将所述噪声图像和所述描述文本输入图像生成模型,得到所述描述文本对应的第一预测噪声;所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的,所述分割掩码与所述样本图像所对应图像描述中的实体词和属性对应;根据所述噪声图像和所述第一预测噪声,生成所述描述文本所对应的目标图像。本申请实施例可以提高所生成的目标图像与描述文本之间的语义一致性和画面美观性,而且可以提高图像生成效率,可以节省存储成本。
本发明授权图像生成方法、模型训练方法、装置、设备及存储介质在权利要求书中公布了:1.一种图像生成方法,其特征在于,包括: 在接收到待生成图像的描述文本时,随机生成噪声图像; 将所述噪声图像和所述描述文本输入图像生成模型,得到所述描述文本对应的第一预测噪声;所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的,所述分割掩码与所述样本图像所对应图像描述中的实体词和属性对应; 根据所述噪声图像和所述第一预测噪声,生成所述描述文本所对应的目标图像; 其中,所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的,包括: 根据所述高斯噪声和所述噪声分布,确定所述图像生成模型的均方误差损失函数值; 根据所述分割掩码,确定掩码优化损失函数值,掩码优化损失函数用于增强跨注意力机制在所述分割掩码内部的第一注意力分数以及减小跨注意力机制在所述分割掩码外部的第二注意力分数; 根据所述高斯噪声、所述噪声分布和所述分割掩码,对所述图像生成模型的网络参数进行调整。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信人工智能科技(北京)有限公司,其通讯地址为:100034 北京市西城区西四北大街156、158、160号2幢1至2层2-6、2-9内01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。