深圳市城市规划设计研究院股份有限公司何松伦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市城市规划设计研究院股份有限公司申请的专利一种基于扩散模型的图像生成方法、控制器和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119693487B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510199745.3,技术领域涉及:G06T11/00;该发明授权一种基于扩散模型的图像生成方法、控制器和存储介质是由何松伦;孔祥伟;俞露;黄卫东;李启军;魏晨;李鑫设计研发完成,并于2025-02-24向国家知识产权局提交的专利申请。
本一种基于扩散模型的图像生成方法、控制器和存储介质在说明书摘要公布了:本申请涉及人工智能技术领域,公开了一种基于扩散模型的图像生成方法、控制器和存储介质,基于扩散模型的图像生成方法包括获取城市场景图像数据集,并对城市场景图像数据集进行分类处理,得到第一批次城市场景图像、第二批次城市场景图像和第三批次城市场景图像;将第一批次城市场景图像、第二批次城市场景图像和第三批次城市场景图像输入至扩散模型进行迭代训练处理,得到经训练的扩散模型;获取待处理城市场景图像,将待处理城市场景图像输入至经训练的扩散模型,得到与待处理城市场景图像对应的特征图像。本申请有利于提高城市场景图像的特征多样性和提高场景图像特征学习的准确性,使得场景图像具备优秀的表达效果。
本发明授权一种基于扩散模型的图像生成方法、控制器和存储介质在权利要求书中公布了:1.一种基于扩散模型的图像生成方法,其特征在于,包括:获取城市场景图像数据集,并对所述城市场景图像数据集进行分类处理,得到第一批次城市场景图像、第二批次城市场景图像和第三批次城市场景图像,其中,所述第一批次城市场景图像为未经筛选的多视点城市场景图像,所述第二批次城市场景图像为高于第一预设分辨率的高清城市场景图像,所述第三批次城市场景图像为预设主题专项图集的场景图像;将所述第一批次城市场景图像、第二批次城市场景图像和第三批次城市场景图像输入至扩散模型进行迭代训练处理,得到经训练的扩散模型,包括:以第一学习率和第一学习频次对所述第一批次城市场景图像进行配对训练,以使所述第一批次城市场景图像形成提示词与各种场景图像的映射关系;以第二学习率和第二学习频次对所述第二批次城市场景图像进行特征采样训练,以使所述第二批次城市场景图像的特征多样化;以第三学习率和第三学习频次对所述第三批次城市场景图像进行强化训练,以使所述第三批次城市场景图像形成特征词与对应类型的场景图像一一对应的映射关系,具体地,以第三学习率和第三学习频次基于所述扩散模型对所述第三批次城市场景图像进行强化训练;通过正则化训练方式将某一特定类型的场景图像与某个或几个特征词绑定起来,并生成对应的关键词;当响应于所述关键词,生成与所述关键词对应类型的场景图像;获取待处理城市场景图像,将所述待处理城市场景图像输入至所述经训练的扩散模型,得到与所述待处理城市场景图像对应的特征图像,具体地,确定所述第三批次城市场景图像的路径,并正规则所述第三批次城市场景图像的路径和正则化先验损失权重;设置所述第三批次城市场景图像的分辨率,并启用StableDiffusion中的arb桶以允许非固定宽高比的第三批次城市场景图像;设置所述arb桶的最小分辨率为第一阈值、最大分辨率为第二阈值,设置所述arb桶的分辨率划分单位为第三阈值;设置所述扩散模型的训练轮数为第四阈值,设置训练批量大小为第五阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市城市规划设计研究院股份有限公司,其通讯地址为:518000 广东省深圳市福田区振兴路3号建艺大厦10楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。