Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华中科技大学;武汉麦塔威科技有限公司蔡新元获国家专利权

华中科技大学;武汉麦塔威科技有限公司蔡新元获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华中科技大学;武汉麦塔威科技有限公司申请的专利一种基于深度学习的文生图扩散模型的训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119048615B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410930748.5,技术领域涉及:G06T11/00;该发明授权一种基于深度学习的文生图扩散模型的训练方法是由蔡新元设计研发完成,并于2024-07-11向国家知识产权局提交的专利申请。

一种基于深度学习的文生图扩散模型的训练方法在说明书摘要公布了:本发明涉及一种基于深度学习的文生图扩散模型的训练方法,涉及人工智能技术领域。该基于深度学习的文生图扩散模型的训练方法,通过获取文本训练数据、图像训练数据以及联合训练数据;基于文本训练数据和图像训练数据分别对文生图扩散模型进行阶段预训练,包括文本阶段预训练和图像阶段预训练;基于联合训练数据对阶段预训练后的文生图扩散模型进进行联合训练,并对每次联合训练结果进行评估调整,直至文生图扩散模型符合预期标准,本发明通过多阶段预训练、利用联合训练数据、结合BERT模型与生成对抗网络、引入扩散过程逐步去除噪声以及动态调整学习率,显著提高文生图扩散模型的训练精度和生成图像的质量。

本发明授权一种基于深度学习的文生图扩散模型的训练方法在权利要求书中公布了:1.一种基于深度学习的文生图扩散模型的训练方法,其特征在于,包括以下步骤: 获取文本训练数据、图像训练数据以及联合训练数据; 基于文本训练数据和图像训练数据分别对文生图扩散模型进行阶段预训练,包括文本阶段预训练和图像阶段预训练; 基于联合训练数据对阶段预训练后的文生图扩散模型进行联合训练,并对每次联合训练结果进行评估调整,直至文生图扩散模型符合预期标准; 所述文生图扩散模型中的文本编码器具体为生成对抗网络,所述生成对抗网络包括生成器和判别器,基于图像训练数据对文生图扩散模型进行图像阶段预训练的具体过程如下: 对生成对抗网络进行初始化处理; 读取用于训练文生图扩散模型中的图像生成器的若干个文本语义向量以及对应的文本语义图像数据,并建立图像数据集,同时划分为图像数据训练集和图像数据验证集; 基于图像数据训练集对生成对抗网络进行循环训练,具体为由生成对抗网络中的生成器接收每个文本语义向量,并生成对应的文本图像; 基于文本图像以及对应的文本语义图像对生成对抗网络中的判别器进行判别训练; 对生成对抗网络中的生成器和判别器进行对抗训练,并分别计算生成器损失函数和判别器损失函数; 基于图像数据验证集对生成对抗网络的每次训练结果进行性能评估,并根据验证结果调节模型参数,直至生成对抗网络预测的文本图像符合对应的文本语义图像; 计算生成器损失函数和判别器损失函数的具体公式分别如下: ; 其中,为生成器损失函数,为生成对抗网络中的生成器接收的第个文本语义向量,为由第个文本语义向量生成的文本图像,为判别器对生成器生成的图像的输出,为生成对抗网络中的生成器接收的第个文本语义向量所对应的文本语义图像,和分别为判别器对真实图像和生成图像的判断概率,为判别器损失函数,为生成对抗网络中判别器接收的第个文本语义向量的图像标签,,为获取的用于训练文生图扩散模型中的图像生成器的文本语义向量的个数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学;武汉麦塔威科技有限公司,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。