电子科技大学叶润获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种数据集制作困难下的图像语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115187777B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210650449.7,技术领域涉及:G06V10/26;该发明授权一种数据集制作困难下的图像语义分割方法是由叶润;闫斌;周小佳;李智勇设计研发完成,并于2022-06-09向国家知识产权局提交的专利申请。
本一种数据集制作困难下的图像语义分割方法在说明书摘要公布了:该发明公开了一种数据集制作困难下的图像语义分割方法,属于图像处理领域。本发明设计的ACGAN相比于现有的数据增广方法,比如翻转,旋转,平移,缩放等,不会破坏目标图像中的上下文信息,并且能够生成与真实场景极为相似的数据,用于语义分割网络训练时其他数据增广方法可能会使图像语义信息发生改变,但是本发明生成出来的样本由于与真实场景极其相似,不会丢失语义信息。本发明设计的AC‑Net相比于其他语义分割给方法,在卷积层设计了两路卷积,并且融合了多尺度特征信息,能够提取更丰富的特征信息,从而提升分割效果。
本发明授权一种数据集制作困难下的图像语义分割方法在权利要求书中公布了:1.一种数据集制作困难下的图像语义分割方法,该方法包括: 步骤1:样本的预处理以及数据增广; 步骤1.1:获取样本图像,并对样本图像进行分辨率归一化,然后将样本图像与其对应的语义标签可视化图像拼接为新图像; 步骤1.2:采用ACGAN模型对步骤1得到的新图像进行数据增广; 所述ACGAN模型包括:生成器和判别器,所述生成器一共有18层结构,包括编码部分和解码部分;所述编码部分包括:依次连接的第1层到第8层,其中第1层为双路卷积结构,该结构包括3路,输入直接分为3路,其中2路结构相同,这两路依次经过2个3x3卷积层,并且第二个3x3卷积层的输入和输出拼接后作为该路的输出,另外的一路为一个1x1的卷积层,三路的输出共同融合后为该双路卷积结构的输出;第2层为核为2的最大池化结构,第1层与第2层组成了一组卷积池化结构,后续第3、4层,5、6层、7、8层同样为这种卷积池化结构;所述解码部分包括:依次连接的第9层到第18层,第9层结构为与第1层结构相同,第10层为上采样结构,通过双线性插值实现,第11、12层与第9层、10层结构对应相同,第13层与第1层结构相同;第14层是双注意力机制结构,该结构通过DANet中的位置注意力机制以及通道注意力机制组成,第15层是上采样结构,16层是双路卷积结构,17层是上采样结构,18层与第1层结构相同;并且,第1层的输出与第18层的输出拼接作为第18层的输出,第3层的输出与第16层的输出拼接作为第16层的输出,第5层的输出与第13层的输出拼接作为第13层的输出,第7层的输出与第11层的输出拼接作为第11层的输出; 数据输入生成器结构之后,会输出一个生成图像,该生成图像接下来进入判别器中; 所述判别器为全卷积结构,一共有5层结构,其中前三层是3个步长为2的4×4卷积,后面两层是2个步长为1的4×4卷积,生成器生成图像进入到判别器后输出一个标量值,范围在[0,1]之间,通过输入训练数据不断训练生成器以及判别器,最终判别器输出稳定在0.5时训练结束;此时,向训练好的生成器输入样本,就能生成一个新数据,该新数据为增广的样本; 步骤2:建立语义分割网络;该语义分割网络与步骤1中的生成器结构相同;但是训练过程与步骤1不同,步骤1中训练生成器时,输入的是语义标签,而在分语义分割网络训练中输入的是Cityscapes训练集原始图像,步骤1中损失函数使用的是条件生成对抗网络的cGAN-Loss,语义分割网络损失函数为交叉熵损失函数CrossEntropyLoss; 步骤3:采用步骤1预处理好的数据训练步骤2得到的语义分割网络,采用训练好的语义分割网络进行实际的图像语义分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。