深圳北理莫斯科大学雍珊珊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳北理莫斯科大学申请的专利一种用于卷积神经网络的模型推理方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116957010B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310857190.8,技术领域涉及:G06N3/0464;该发明授权一种用于卷积神经网络的模型推理方法和装置是由雍珊珊;陈强;樊华;宋若鹏;朱楷铭;陈锦鸿设计研发完成,并于2023-07-13向国家知识产权局提交的专利申请。
本一种用于卷积神经网络的模型推理方法和装置在说明书摘要公布了:本申请公开了一种用于卷积神经网络的模型推理方法和装置,首先提取已完成训练的第一卷积神经网络模型的模型参数;然后对提取模型参数进行剪枝,以去除其值在第一阈值区间的模型参数,保留其值在第二阈值区间的模型参数;再对每个模型参数进行量化处理,以获取每个所述模型参数的标志位、符号位和有效宽位的值;其中,模型参数的有效宽位的值为定点数值,是应用二分段量化方法或多分段量化方法对模型参数进行量化处理获得;最后将量化处理后获得的模型参数替换原模型参数,以获取第二卷积神经网络模型。由于新的卷积神经网络模型的模型参数是依据已完成训练的模型参数获取,大大提高了新卷积神经网络模型的训练效率。
本发明授权一种用于卷积神经网络的模型推理方法和装置在权利要求书中公布了:1.一种用于卷积神经网络的模型推理方法,其特征在于,包括: 步骤101,提取已完成训练的第一卷积神经网络模型的模型参数;所述第一卷积神经网络模型用于提取第一图像特征;所述第一卷积神经网络模型的模型参数包括权重; 步骤102,对提取的所述第一卷积神经网络模型的模型参数进行剪枝,以去除其值在第一阈值区间的模型参数,保留其值在第二阈值区间的模型参数;所述第一阈值区间在所述第二阈值区间的范围内; 步骤103,对每个所述模型参数进行量化处理,以获取每个所述模型参数的标志位、符号位和有效宽位的值;其中,所述模型参数的有效宽位的值为定点数值,是应用二分段量化方法或多分段量化方法对所述模型参数进行量化处理获得; 步骤104,将量化处理后获得的所述模型参数替换所述第一卷积神经网络模型的模型参数,以获取第二卷积神经网络模型;所述第二卷积神经网络模型用于提取第二图像特征; 所述第一图像特征与所述第二图像特征不同; 对占比较高的绝对值小于一第一预设初始值的模型参数应用所述二分段量化方法进行量化处理; 所述二分段量化方法对所述模型参数进行量化处理包括: 标识所述模型参数的标志位、符号位和有效位宽,并设定有效位宽的中间为一个切分点;所述标志位用于表示所述模型参数的值是高位值还是低位值,所述符号位用于表示所述模型参数的值是正值或负值,所述有效位宽用于表示模型参数的有效值; 清除所述模型参数有效位宽在所述切分点之前的数据,以减少所述有效位宽,并将减少所述有效位宽的数据作为所述第二卷积神经网络模型的模型参数; 对占比较低的绝对值不小于所述第一预设初始值的模型参数应用所述多分段量化方法进行量化处理; 所述多分段量化方法对所述模型参数进行量化处理包括: 标识所述模型参数的标志位、符号位和有效位宽,并按预设步长在所述有效位宽上设定至少两个切分点;所述标志位用于表示所述模型参数的值是高位值还是低位值,所述符号位用于表示所述模型参数的值是正值或负值,所述有效位宽用于表示模型参数的有效值; 清除所述模型参数有效位宽在最后一个所述切分点之前的数据,以减少所述有效位宽,并将减少所述有效位宽的数据作为所述第二卷积神经网络模型的模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳北理莫斯科大学,其通讯地址为:518000 广东省深圳市龙岗区龙城街道大运新城国际大学园路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励