中国科学技术大学赵峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利一种无需图像的底层视觉预训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119624833B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411709948.4,技术领域涉及:G06T5/77;该发明授权一种无需图像的底层视觉预训练方法是由赵峰;王思扬设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。
本一种无需图像的底层视觉预训练方法在说明书摘要公布了:本发明涉及底层视觉预训练技术领域,公开了一种无需图像的底层视觉预训练方法,包括:从高斯分布中随机采样,得到纯高斯噪声图像;对纯高斯噪声图像执行频率感知掩蔽策略,得到输入图像;频谱信息重建预训练,对需要预训练的底层视觉模型的结构进行第一次修改;下游降质复原任务微调,保留预训练的第一次修改后的底层视觉模型的参数,并第二次修改底层视觉模型的结构,以进行下游任务的训练。本发明基于退化信息在频谱域上表现出的干扰模式的类别差异性,提出了频率感知掩蔽策略,打破了传统的从数据中学习任务通用信息的预训练范式,仅使用一张随机生成的高斯噪声图像,以极低的计算成本实现了退化类型不可知的通用可转移性表示学习。
本发明授权一种无需图像的底层视觉预训练方法在权利要求书中公布了:1.一种无需图像的底层视觉预训练方法,包括以下步骤: 步骤一,从高斯分布中随机采样,得到纯高斯噪声图像,具体包括:设定高斯分布,其中,,,从高斯分布中随机采样得到二维矩阵,进行三通道复制:;;其中,表示随机采样操作;表示拼接操作,最终得到纯高斯噪声图像; 步骤二,对纯高斯噪声图像执行频率感知掩蔽策略,得到底层视觉模型预训练的输入图像;所述频率感知掩蔽策略包括随机掩膜生成过程和频谱掩蔽过程;随机掩膜生成过程用于模拟降质信息干扰的不确定性;频谱掩蔽过程用于模拟降质信息的干扰;所述随机掩膜生成过程具体包括:将输入图像的振幅谱看作是具有单位宽度的同心正方形的组合,以设定的比例并遵循均匀分布随机抽样同心正方形,得到与输入图像同等大小的随机掩膜M,以消除频率分布的连续性造成的信息冗余:;;;其中,W、H分别为随机掩膜的长和宽,与输入图像的尺寸相同;R为掩蔽框最大采样半径;r为采样比例;N为掩膜生成过程需要得到的掩蔽框数量;表示均匀随机抽样同心正方形框的过程; 所述频谱掩蔽过程具体包括:通过傅里叶变换将纯高斯噪声图像从空域映射到频域,分别得到对应的幅谱和相位谱,然后使用随机掩膜生成过程得到的随机掩膜M对幅度谱进行掩膜操作,得到信息被破坏的幅度谱,最后通过傅里叶逆变换将信息完整的相位谱与信息被破坏的幅度谱映射回空域,得到底层视觉模型预训练的输入图像:;;;其中,为傅里叶变换,将图像由空域映射到频域;为傅里叶逆变换,将图像由频域映射回空域; 步骤三,频谱信息重建预训练:对需要预训练的底层视觉模型的结构进行第一次修改,包括:修改底层视觉模型从而将修改后的底层视觉模型作为编码器模块,以及增加解码器模块; 步骤四,下游降质复原任务微调:保留预训练的第一次修改后的底层视觉模型的参数,并第二次修改底层视觉模型的结构,对底层视觉模型的结构进行第二次修改的过程包括保留编码器模块,并通过适应模块替换解码器模块,以进行下游任务的训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励