北京邮电大学王思野获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116861257B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311033595.6,技术领域涉及:G06F18/214;该发明授权基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法是由王思野;李元东;赵中原;梁步顺;徐文波;赖锦林;麦吉设计研发完成,并于2023-08-16向国家知识产权局提交的专利申请。
本基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法在说明书摘要公布了:本发明公开了一种基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法,在知识蒸馏的实现中,除了引入蒸馏损失用于学生模型拟合教师模型的logits输出,还使用输出概率分布与真实标签的交叉熵损失,以确保学生模型的输出与样本的真实标签相互匹配。这两部分损失共同构成目标函数,帮助学生模型从教师模型的“暗知识”中进行学习,优化模型的输出概率分布,从而提高剪枝模型的准确率。另外,本发明将知识蒸馏应用于LSTM模型的剪枝过程中,通过合理传递知识,使得剪枝后的模型具备更强的表征能力。
本发明授权基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法在权利要求书中公布了:1.一种基于知识蒸馏恢复策略剪枝的长短期记忆压缩方法,其特征在于,包括: 步骤S1、根据得到的数据集训练长短期记忆模型,获得具有预设的泛化能力的原始模型,保存所述原始模型;对于单句文本分类任务,选择GLUE的SST-2数据集;对于句子对匹配任务,选择GLUE的QQP数据集; 步骤S2、设置剪枝参数,所述剪枝参数包括权重剪枝方法、稀疏度的初始值、稀疏度的期望值; 步骤S3、根据所述权重剪枝方法评估连接或权重块的重要性,排序后根据所述稀疏度确定修剪比例,根据所述修剪比例将对应的参数置零,同时禁止已经置零的参数进行更新,得到剪枝模型; 步骤S4、使用知识蒸馏方法对所述剪枝模型进行训练,将所述原始模型作为教师,将所述剪枝模型作为学生,通过在损失函数中加入蒸馏损失,使得学生模型拟合教师模型的logits输出,迭代训练预设的次数之后,得到精度恢复的模型; 步骤S5、评估所述精度恢复的模型的精度,调整所述稀疏度,根据预设的精度损失范围增减所述稀疏度,返回步骤S3继续剪枝,直至达到所述稀疏度的期望值或满足预设的终止条件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。