湖南师范大学刘双龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南师范大学申请的专利基于逐列最大化剪枝的LSTM硬件加速器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120297353B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510788755.0,技术领域涉及:G06N3/082;该发明授权基于逐列最大化剪枝的LSTM硬件加速器是由刘双龙;龚源昊;沈万;周博通;马嘉琦设计研发完成,并于2025-06-13向国家知识产权局提交的专利申请。
本基于逐列最大化剪枝的LSTM硬件加速器在说明书摘要公布了:本发明公开了一种基于逐列最大化剪枝的LSTM硬件加速器,包括向量处理单元、矩阵向量计算核、并行输入串行输出的移位寄存器、权重存储模块和激活函数模块;向量处理单元将输入向量和隐藏层输出向量编码为稀疏向量,并用AIDX表示其中非零元素的位置编码;权重存储模块根据AIDX并行地从片上存储器发送匹配的非零权重参数;矩阵向量计算核使用稀疏向量的非零元素和权重存储模块索引的非零权重参数进行矩阵计算;移位寄存器缓存矩阵向量计算核的计算结果,并以串行方式传输至激活函数模块;激活函数模块负责计算sigmoid、tanh函数和逐元素运算。本发明能确保剪枝后的稀疏矩阵结构规则分布与硬件并行计算特性匹配,提升资源利用率。
本发明授权基于逐列最大化剪枝的LSTM硬件加速器在权利要求书中公布了:1.一种基于逐列最大化剪枝的LSTM硬件加速器,其特征在于,包括:向量处理单元、矩阵向量计算核、并行输入串行输出的移位寄存器、权重存储模块和激活函数模块; 所述向量处理单元用于:将输入向量和隐藏层输出向量编码为稀疏向量和,并用AIDX表示稀疏向量非零元素的位置编码; 所述权重存储模块用于:根据位置编码AIDX并行地从片上存储器发送匹配的非零权重参数; 所述矩阵向量计算核用于:使用向量处理单元传输的稀疏向量的非零元素和权重存储模块索引的非零权重参数进行矩阵计算; 所述移位寄存器用于:缓存矩阵向量计算核的计算结果,并以串行方式传输至激活函数模块; 所述激活函数模块负责计算sigmoid、tanh函数和逐元素运算; 所述LSTM硬件加速器用于实现基于逐列最大化剪枝的LSTM加速方法,所述LSTM加速方法包括: 步骤1,针对LSTM包括的各权重矩阵,根据其对LSTM精度的敏感度分类为敏感型和非敏感型; 步骤2,对敏感型和非敏感型权重矩阵设置不同的稀疏度组合值,按照各稀疏度组合值对LSTM各权重矩阵进行逐列最大化剪枝,然后根据对应剪枝后的LSTM精度确定获得最优的稀疏度组合值; 步骤2.1,将敏感型和非敏感型权重矩阵的稀疏度、设置在预设低水平,将当前最大的整体稀疏度预设为0; 步骤2.2,以当前稀疏度对LSTM的每个非敏感型权重矩阵进行逐列剪枝,以当前稀疏度对LSTM的每个敏感型权重矩阵进行逐列剪枝; 步骤2.3,对剪枝后的LSTM进行训练并计算LSTM的模型精度和整体稀疏度; 步骤2.4,判断是否满足且,其中为预训练模型精度,为模型精度的可接受阈值; 若满足则将当前稀疏度组合作为当前最优的稀疏度组合,并将当前赋值给; 步骤2.5,将当前稀疏度增加间隔α,若增加后仍小于100%,则返回执行步骤2.2,否则执行步骤2.6; 步骤2.6,将当前稀疏度增加间隔α,若增加后仍小于100%,将稀疏度设置回预设低水平则返回执行步骤2.2,否则执行步骤2.7; 步骤2.7,输出当前最优的稀疏度组合; 步骤3,按照最优的稀疏度组合值对LSTM各权重矩阵进行逐列最大化剪枝,实现LSTM加速。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南师范大学,其通讯地址为:410081 湖南省长沙市岳麓区麓山路36号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。