宁波大学王翀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉宁波大学申请的专利基于视觉提示词微调的视觉模型剪枝优化方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119692414B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411764743.6,技术领域涉及:G06V10/82;该发明授权基于视觉提示词微调的视觉模型剪枝优化方法和系统是由王翀;林孙旗;冯洋洋设计研发完成,并于2024-12-03向国家知识产权局提交的专利申请。
本基于视觉提示词微调的视觉模型剪枝优化方法和系统在说明书摘要公布了:本发明公开了基于视觉提示词微调的视觉模型剪枝优化方法和系统。所述方法包括:提供待剪枝模型,待剪枝模型为视觉Transformer模型,模型包括多层级的块,前一级的块向后一级的块传递图像特征;在传递过程中对块进行剪枝优化,图像特征中被插入了视觉提示词,视觉提示词体现当前被剪除的特征标记的综合特征,块基于包含视觉提示词的前一级图像特征生成后一级图像特征。本发明所提供的技术方案为模型轻量化提供一个即插即用的解决方案,通过构建视觉提示词来代表被剪除的部分特征向后传递,避免了模型剪枝对模型性能带来的明显损失,加速模型微调进程并减少模型压缩过程中的性能损失,从而实现高压缩效率与低训练开销的兼得。
本发明授权基于视觉提示词微调的视觉模型剪枝优化方法和系统在权利要求书中公布了:1.一种基于视觉提示词微调的视觉模型剪枝优化方法,所述视觉模型用于进行图像识别,所述视觉模型剪枝优化方法包括: 提供待剪枝模型,所述待剪枝模型为视觉Transformer模型且经过预训练,所述视觉Transformer模型包括多层级的块,前一级的块向后一级的块传递图像特征,最前一级的块基于训练图形提取初始的图像特征; 在所述图像特征的传递过程中对所述块进行剪枝优化; 其特征在于,所述图像特征中被插入了视觉提示词,所述视觉提示词体现当前被剪除的特征标记的综合特征,所述块基于包含所述视觉提示词的前一级图像特征生成后一级图像特征,在所述剪枝优化的过程中,仅开放与所述视觉提示词直接相关的参数的训练,冻结其余参数; 所述图像特征的传递过程表示为: Z1=L1INSERTE,VPT;ρ1 Zi=LiINSERTZi-1,VPT;ρi-1i=2,3,…,N 其中,Z1表示初始的所述图像特征,Zi表示其余的所述图像特征,L表示对应的块,INSERTE,VPT表示所述图像特征,ρ表示所在的块对应的剪枝率; 所述块包括前馈神经网络层和多头自注意力层,所述剪枝优化表示为: Li·=PFFNMSA·;ρi或Li·=FFNPMSA·;ρi 其中,FFN表示所述前馈神经网络层,MSA表示所述多头自注意力层,P表示所述剪枝优化的策略,包括类标记剪枝、注意力头剪枝、前馈网络剪枝中的任意一种或多种的组合; 所述剪枝优化的损失评价方法包括评估插入所述视觉提示词所引起的额外开销与插入所述视觉提示词所缓解的性能损失之间的大小关系; 所述额外开销的计算过程表示为: FLOPsoriginal=OL2·d+2·L·d·dff; FLOPswithVPT=OL+n2·d+n·dvpt+2·L+n·d+n·dvpt·dff; FLOPsextra=FLOPswithVPT-FLOPsoriginal; 其中,FLOPsextra表示所述额外开销,FLOPsoriginal表示原始预期开销,FLOPswithVPT表示当前预期开销,O·表示算法的时间复杂度或空间复杂度,L表示输入序列的长度,d表示每个标记的嵌入维度,dff表示前馈神经网络中的隐藏层维度,n表示所述视觉提示词的标记数量,dvpt表示在所述视觉提示词中每个标记的特征维度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宁波大学,其通讯地址为:315000 浙江省宁波市江北区风华路818号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励