清华大学深圳国际研究生院李秀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院申请的专利一种基于内容与风格解析器的图像风格转换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119941491B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510005208.0,技术领域涉及:G06T3/04;该发明授权一种基于内容与风格解析器的图像风格转换方法是由李秀;黄妮莎设计研发完成,并于2025-01-02向国家知识产权局提交的专利申请。
本一种基于内容与风格解析器的图像风格转换方法在说明书摘要公布了:一种基于内容与风格解析器的图像风格转换方法,包括:利用稳定扩散模型对图像内容特征进行学习和编码。构建风格解析器,采用视觉变形器ViT提取风格特征,并通过多层感知器生成风格嵌入。内容解析器通过分层处理内容图像,生成内容嵌入,并利用残差加法整合到模型中,使内容特征在风格转换中得到保留。在推理阶段,风格嵌入被注入上采样块以增强风格表达,而内容嵌入则注入下采样块以确保内容的完整性。该方法有效解决了传统扩散模型训练资源密集和风格与内容纠缠的问题,减少了单向偏差,全方位提升了图像质量和风格相似度。在视觉体验上,生成的图像在质量、内容与风格相似度间达到精妙平衡,显著优化了用户视觉体验。
本发明授权一种基于内容与风格解析器的图像风格转换方法在权利要求书中公布了:1.一种基于内容与风格解析器的图像风格转换方法,其特征在于,包括以下步骤: S1. 构建基础模型:采用稳定扩散模型作为基础架构,通过加噪和去噪过程实现对图像内容特征的学习和编码; S2. 构建风格解析器并提取风格特征:利用视觉变形器ViT作为风格解析器,从参考图像中提取风格特征,并通过多层感知器生成风格嵌入; S3. 构建内容解析器并提取内容特征:构建内容解析器,通过分层处理内容图像,生成多个层次的潜在表示作为内容嵌入,通过残差加法将内容嵌入整合到模型中,以稳固内容架构并在风格转换过程中保留内容特征; S4. 构建内容控制器并注入内容:通过内容控制器处理内容图像,捕获基本结构并最小化风格特征的干扰; 所述内容控制器的操作具体包括: 采用平铺控制策略,以保留内容信息同时不影响风格转换过程; 利用ControlNet在U‑Net架构内管理空间信息,捕获内容图像的基本结构,最小化风格特征的干扰; 通过内容融合编码器整合内容,生成多个层次的潜在表示,形成内容嵌入; 通过残差加法将内容嵌入整合到U‑Net中; 通过ControlNet机制,将内容嵌入精确注入到扩散模型的上采样块中,以实现内容与风格的分离和转换; S5. 注入风格与内容:将风格嵌入注入模型的上采样块以增强风格表达,同时将内容嵌入注入模型的下采样块以确保内容保留; S6. 推理:在推理阶段,利用构建的内容解析器和风格解析器实现风格与内容的解耦,捕捉并再现复杂风格,同时保持内容的完整性; 步骤S6中,所述推理包括用于内容保留的反转操作,具体包括: 在采样过程中,对输入图像进行编码至潜在空间,并通过ReNoise技术逆转采样过程,直接从真实图像生成潜在噪声表示,以此消除额外噪声注入的需要; 采用迭代方法更新噪声,通过平均预测增强对前向扩散进展中预期位置的近似。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518071 广东省深圳市南山区桃源街道丽水路2279号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励