南京理工大学王宏波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利一种基于FPGA的卷积神经网络块剪枝方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115994571B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211624266.4,技术领域涉及:G06N3/082;该发明授权一种基于FPGA的卷积神经网络块剪枝方法是由王宏波;杨帅;庄志洪;杨苏成设计研发完成,并于2022-12-15向国家知识产权局提交的专利申请。
本一种基于FPGA的卷积神经网络块剪枝方法在说明书摘要公布了:本发明公开了一种基于FPGA的卷积神经网络块剪枝方法,包括步骤:进行网络训练或使用预训练网络,并记录网络精度;将连续权重分组为预定大小的块,并确定每个块的平均值;按照剪枝百分比p从平均值最低的块进行迭代剪枝;记录剪枝网络精度,当原始网络精度和剪枝网络的精度之间的差异低于阈值时,迭代地增加剪枝的百分比p,继续进行剪枝;确定合适的剪枝百分比p后,对数据进行8位量化;微调网络后,输出网络参数,通过神经网络进行图像识别。本发明方法计算过程简单,推理性能高。
本发明授权一种基于FPGA的卷积神经网络块剪枝方法在权利要求书中公布了:1.一种基于FPGA的卷积神经网络块剪枝方法,基于FPGA架构,包括步骤: S10,进行卷积神经网络训练或使用预训练网络,并获取网络精度; S20,将连续权重分组为预定大小的块,并确定每个块的平均值; S30,按照剪枝百分比p从平均值最低的块进行迭代剪枝,剪枝后剩余的块存储为稀疏向量,其中每个位置包含权重块和下一块的索引; S40,获取剪枝网络精度,当原始网络精度和剪枝网络的精度之间的差异低于阈值时,迭代地增加剪枝的百分比p,继续重复步骤S30进行剪枝,直到满足要求; S50,获取满足要求的剪枝百分比p,对网络权重进行量化; S60,获取卷积神经网络参数,输入图像特征至卷积神经网络进行图像识别; 所述FPGA架构包括ARM处理器、控制器、外部存储器、输入输出特征图存储器、权重存储器、配置指令控制单元、激活与池化单元、PE阵列和索引地址生成器;其中: 所述ARM处理器、控制器、配置指令控制单元用于处理控制指令,对每层信息进行加载更新等操作; 所述输入输出特征图存储器、权重存储器用于存放从外部存储器中读取的数据,同时也存放计算完成的激活数据; 所述激活与池化单元在卷积神经网络的卷积层或全连接层的输出通道结果计算完成后,从稀疏计算加速模块的部分和累加器中取出结果进行ReLu操作或池化操作,再写入输出特征图存储器中; 所述PE阵列用于完成卷积神经网络的卷积和点积运算; 所述索引地址生成器用于储存索引并生成输入输出特征图存储器的读取地址,且根据剪枝块大小对其内部结构进行修改; 所述索引地址生成器根据剪枝块大小对其内部结构进行修改,具体包括: 块大小=4:索引将会两两并行存储在FIFO中,在读取时将会从权重存储器中并行读取两个权重块,从两个并行索引中生成两个读取地址,每个双端口特征图存储器为一行中的同一内核提供两个四次激活块,在这种情况下,每一层中的每个核心采用一个双端口存储器; 块大小=2:四个索引并行存储在FIFO中,四个块将从权重存储器中并行读取,总共八个权重,从四个并行索引生成四个读取地址,必须复制输入输出特征图存储器内存以提供同一特征图存储器映射的四个端口,每一层中的每个核心采用两个双端口存储器; 块大小=1:正常修剪,八个索引并行存储在FIFO中,从八个并行索引生成八个读取地址,必须复制输入输出特征图存储器内存以提供八个同一输入输出特征图存储器映射端口,每一层中的每个核心采用四个双端口存储器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励