清华大学刘勇攀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利基于动态精度量化的神经网络模型训练加速方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116187413B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211700187.7,技术领域涉及:G06N3/08;该发明授权基于动态精度量化的神经网络模型训练加速方法及系统是由刘勇攀;刘若洋;韦辰翰;杨一雄;王文迅;杨华中设计研发完成,并于2022-12-28向国家知识产权局提交的专利申请。
本基于动态精度量化的神经网络模型训练加速方法及系统在说明书摘要公布了:本发明提供一种基于动态精度量化的神经网络模型训练加速方法及系统,在神经网络模型训练开始前,将运算过程中涉及的数据矩阵分为逻辑上的小块;训练过程中,每块数据的量化范围及该块数据对应的梯度值计算其量化敏感度,并将敏感度以块与块之间的最优相对量化位宽表示;根据网络当前训练步数,确定当前所需的平均量化位宽目标;结合相对量化位宽、平均量化位宽目标,及预先设定的硬件所支持最大最小计算位宽参数,动态确定各块权重值及激活值数据的绝对量化位宽;将训练数据按照绝对量化位宽量化以得到低精度的量化后数据用于计算,完成神经网络模型的训练计算加速,本发明解决现有神经网络训练速度慢、难以直接得到量化位宽理论最优值的问题。
本发明授权基于动态精度量化的神经网络模型训练加速方法及系统在权利要求书中公布了:1.一种基于动态精度量化的神经网络模型训练加速方法,其特征在于,包括: 在神经网络模型训练开始前,将运算过程中所涉及的数据矩阵分为逻辑上的小块; 在训练过程中,每块数据的量化范围及该块数据对应的梯度值计算其量化敏感度,并将所述敏感度以块与块之间的最优相对量化位宽表示; 根据网络当前训练步数,确定当前所需的平均量化位宽目标; 结合所述相对量化位宽、平均量化位宽目标,及预先设定的硬件所支持最大最小计算位宽参数,动态确定各块权重值及激活值数据的绝对量化位宽; 将训练数据按照绝对量化位宽量化以得到低精度的量化后数据用于计算,完成神经网络模型的训练计算加速; 所述在训练过程中,每块数据的量化范围及该块数据对应的梯度值计算其量化敏感度,并将所述敏感度以块与块之间的最优相对量化位宽表示,具体包括: 在神经网络模型训练开始后,每个批次的训练中,获取当前批次的权重值和激活值的分块量化范围及权重值梯度与激活值梯度数据; 将当前批次的权重值和激活值的分块量化范围及权重值梯度与激活值梯度数据与历史数据结合,得到当前轮次的平均每块量化范围和每个数据的平均梯度值,每个轮次包括多个批次; 在每个轮次的训练结束后,按设定公式计算每块数据的相对敏感度,表示为相对量化位宽。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区双清路30号清华大学清华园北京100084-82信箱;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励