北京智源人工智能研究院丁铭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智源人工智能研究院申请的专利一种文本到图像的生成方法、装置、存储介质及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115700519B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110846148.7,技术领域涉及:G06F16/383;该发明授权一种文本到图像的生成方法、装置、存储介质及终端是由丁铭;杨卓毅;洪文逸;郑问迪;周畅;杨红霞;唐杰设计研发完成,并于2021-07-26向国家知识产权局提交的专利申请。
本一种文本到图像的生成方法、装置、存储介质及终端在说明书摘要公布了:本发明公开了一种文本到图像的生成方法、装置、存储介质及终端,方法包括:获取文本描述,并标记化文本描述后生成文本形符序列;根据文本形符序列、预先训练的图像生成模型和向量量化自编码器生成至少一张第一图像;将每张第一图像输入预先训练的评分模型中,得到每张第一图像的概率值;基于每张第一图像的概率值筛选概率值大于预设阈值的第一图像,生成至少一张第二图像;基于预先训练的分辨率提升模型调高第二图像的分辨率,生成目标图像。因此,采用本申请实施例,可以保障生成图像内容与描述文本的语义相一致,大大减小二者之间的误差,还可以有效提升生成图像的分辨率。
本发明授权一种文本到图像的生成方法、装置、存储介质及终端在权利要求书中公布了:1.一种文本到图像的生成方法,其特征在于,所述方法包括: 获取文本描述,并标记化所述文本描述后生成文本形符序列; 根据所述文本形符序列、预先训练的图像生成模型和向量量化自编码器生成至少一张第一图像;其中, 所述根据所述文本形符序列、预先训练的图像生成模型和向量量化自编码器生成至少一张第一图像,包括:将所述文本形符序列输入预先训练的图像生成模型中,输出概率分布;从所述概率分布中获取最大概率值对应的图像形符;将最大概率值对应的所述图像形符拼接至所述文本形符序列之后,生成拼接后的形符序列;统计所述图像形符的数量;当所述图像形符的数量小于预设第一数量时,继续将所述拼接后的形符序列输入所述预先训练的图像生成模型中,直到所述图像形符的数量等于预设第一数量时,生成图像形符集合;将所述图像形符集合输入预先训练的向量量化自编码器的解码器中,生成第一图像; 将每张所述第一图像输入预先训练的评分模型中,得到每张第一图像的概率值;所述评分模型针对生成的每一张图像转换为文本,并计算每个文本的概率值,根据概率值进行评分,根据评分的高低顺序挑选出多张评分高的图像; 基于所述每张第一图像的概率值筛选所述概率值大于预设阈值的第一图像,生成至少一张第二图像; 基于预先训练的分辨率提升模型调高所述第二图像的分辨率,生成目标图像; 其中,所述预先训练的图像生成模型是基于将模型训练的图像形符序列与模型训练的文本形符序列进行拼接后训练生成的。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智源人工智能研究院,其通讯地址为:100083 北京市海淀区中关村东路1号院8号楼三层B201D-1;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。