北京工业大学刘博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利一种基于多尺度生成对抗网络的小样本高质量生成的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115482434B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211132539.3,技术领域涉及:G06V10/774;该发明授权一种基于多尺度生成对抗网络的小样本高质量生成的方法是由刘博;陈铭明;王慧娜设计研发完成,并于2022-09-17向国家知识产权局提交的专利申请。
本一种基于多尺度生成对抗网络的小样本高质量生成的方法在说明书摘要公布了:一种基于多尺度生成对抗网络的小样本高质量生成的方法属于计算机视觉领域,研究了一种针对可以在小样本数据集上生成高分辨率图像的方法。首先利用基于全卷积神经网络构建的生成器,得到生成图像。然后利用基于全卷积神经网络构建的判别器,在隐式上对于图像进行增广,分别对生成图片和真实图像计算距离指标。生成器和判别器组成单层尺度下的图像生成模型。利用图像生成模型构建多层尺度结构,从低到高处理图像的尺寸逐步增大。最后逐层进行动态博弈实现生成图像分布向真实图像分布拟合。本发明解决了小样本的数据集少和生成图像清晰度不够的问题。
本发明授权一种基于多尺度生成对抗网络的小样本高质量生成的方法在权利要求书中公布了:1.基于多尺度生成对抗网络的小样本高质量生成的方法,其特征在于: 首先,利用生成对抗网络训练图像生成模型,其中生成器是由多个卷积层构成的全卷积神经网络;其中判别器也是由多个卷积层构成的全卷积神经网络,输入图像通过多个卷积层得到的输出矩阵,矩阵中每个数据代表着原输入图像中的一个感受野,对应了图像的一片区域,判别器因此可以拉近生成图像和真实图像在各个区域上的距离实现整体分布的拟合,依据此原理实现图像的增广;然后利用多个图像生成模型构建多尺度模型,每一层尺度下都会接收不同尺寸大小的图像,从低到高依次增大;待第一层尺度训练完毕后,图像生成模型会学习到第一层尺度下图像大小的轮廓细节;将第一尺度下生成的图像放大后传入到第二层尺度,放大后的图像较之于第二层尺度下的训练数据集图像会有失真不清晰的现象,所以第二层尺度的图像生成模型就是学习传入图像放大后中缺失的细节信息;逐步增加尺度,最后得到清晰的生成图像; 步骤1:第一层尺度图像生成模型的构建 步骤1.1:基于全卷积神经网络的生成器构建 第一层尺度生成器的输入为符合期望值为0,标准差为1的正态分布的噪声图,卷积前噪声图在上下左右各填充5行,经过5个卷积层进行卷积,卷积核大小皆为3×3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,它将对后续激活函数的输入进行归一化,使得数值更加稳定,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2,使模型收敛更快;第5个卷积层通道数为3,采用双曲正切函数作为激活函数,将输出的数值范围定在-1至1之间;噪声图通过5层卷积后会得到一个与其等大的生成图像,将作为第一层尺度判别器的输入和下一层尺度生成器的输入; 步骤1.2:基于全卷积神经网络的判别器构建 判别器的输入为真实图像或者生成图像,经过5个卷积层,卷积核大小皆为3×3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2;第5个卷积层通道数为1,不添加激活函数;图像通过5层卷积后会得到一个1维矩阵,将矩阵中所有元素的均值作为距离指标,作为后续损失函数的输入; 步骤2:多尺度模型构建 步骤2.1:确定尺度N的数量 原始图像数据集的分辨率大小为700×460;在模型中各尺度图像的输入最小尺寸不能低于32,最大尺寸不能高于256;因此通过缩放将原始数据集图像长宽按等比例缩放至256×168,该大小也会作为最高尺度的输入尺寸大小;在模型中各尺度之间的缩放因子r定为0.75;通过缩放因子r从高到低计算出各尺度的图像输入大小256×168,192×126,144×95,108×72,81×54,61×41,继续向下最小尺寸会低于32,共有6层尺度,所以尺度N设置为6; 步骤2.2:除第一层尺度外,其余尺度图像生成模型构建 第二层包括第二层以上的尺度都需要接收来自上一尺度的生成图像;第n层尺度的生成器的输入为符合标准正态分布的噪声图Zn和来自n-1层尺度生成器生成的图像Fn-1;在输入网络前先通过1r乘上Fn-1对图像进行放大,得到放大的生成图像Fn-1r;将Fn-1r和Zn分别在上下左右各填充5行,相加后输入到5层卷积网络中,其中5个卷积层的卷积核大小皆为3×3,步长皆为1,卷积过程中不进行填充;前4个卷积层通道数全是32xpow2,n4,其中“”是一个算术运算符,表示整数除法,它可以返回商向下取整的整数部分,pow函数用于进行求幂运算2为底数,n4为指数;整体表示每隔4个尺度,通道数就翻倍,所以从第2到第7尺度通道数分别为32,32,32,64,64,64;第5个卷积层通道数为3,采用双曲正切函数作为激活函数,将输出的数值范围定在-1至1之间;最后网络的输出结果会与Fn-1r相加得到的生成图像Fn,Fn会作为判别器的输入和下一尺度生成器的输入; 第n层尺度的判别器的输入为真实图像或者生成图像,经过5个卷积层,卷积核大小皆为3×3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32xpow2,n4,都采用批量归一化,批量归一化后将采用带泄露修正线性单元作为激活函数;第5个卷积层通道数为1,不添加激活函数;图像通过5层卷积后会得到一个1维矩阵,将矩阵中所有元素的均值作为距离指标,作为后续损失函数的输入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励