苏州元脑智能科技有限公司杨继林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利一种数据反量化方法、装置、设备和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119250135B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411388330.2,技术领域涉及:G06N3/0495;该发明授权一种数据反量化方法、装置、设备和计算机可读存储介质是由杨继林设计研发完成,并于2024-09-30向国家知识产权局提交的专利申请。
本一种数据反量化方法、装置、设备和计算机可读存储介质在说明书摘要公布了:本发明涉及深度学习技术领域,公开了一种数据反量化方法、装置、设备和计算机可读存储介质,根据当前组的int4类型的偏置对应的位置信息、当前组的fp16类型的量化系数对应的位置信息,从缓存中读取出int4类型的偏置和fp16类型的量化系数。根据int4类型的权重对应的位置信息,从缓存中读取int4类型的权重。在读取出当前组内所有int4类型的权重时,按照反量化处理规则,对当前组内所有int4类型的权重、int4类型的偏置以及fp16类型的量化系数进行处理,以得到反量化结果。重复执行上述操作直至完成缓存中所有数据的反量化计算。在不支持4bit数据类型的处理器上实现了4bit反量化。
本发明授权一种数据反量化方法、装置、设备和计算机可读存储介质在权利要求书中公布了:1.一种数据反量化方法,其特征在于,包括: 在反量化计算未完成的情况下,根据当前组的int4类型的偏置对应的位置信息,从缓存中读取出int4类型的偏置;根据当前组的fp16类型的量化系数对应的位置信息,从缓存中读取出fp16类型的量化系数;将int4类型的偏置从L3缓存搬移到L2缓存,由各个内核将计算所需的int4类型的权重数据从L2缓存搬移到L1缓存,int4类型的偏置和fp16类型的量化系数由各计算内核直接将计算所需的数据从L3缓存搬移到L1缓存; 在未读取出当前组内所有int4类型的权重的情况下,根据int4类型的权重对应的位置信息,从缓存中读取int4类型的权重; 在读取出当前组内所有int4类型的权重的情况下,按照反量化处理规则,对当前组内所有int4类型的权重、int4类型的偏置以及fp16类型的量化系数进行处理,以得到当前组对应的反量化结果; 在当前组不为最后一组的情况下,将下一组的各类型数据对应的位置信息作为最新的当前组的各类型数据的位置信息,并返回根据当前组的int4类型的偏置对应的位置信息,从缓存中读取出int4类型的偏置;根据当前组的fp16类型的量化系数对应的位置信息,从缓存中读取出fp16类型的量化系数的步骤,直至完成所述缓存中所有数据的反量化计算;其中,各类数据至少包括int4类型的偏置、fp16类型的量化系数和int4类型的权重; 按照反量化处理规则,对当前组内所有int4类型的权重、int4类型的偏置以及fp16类型的量化系数进行处理,以得到当前组对应的反量化结果包括: 将int4类型的权重转换为int8类型的权重;其中,int8类型的权重包括高位int8类型的权重和低位int8类型的权重; 将int4类型的偏置转换为int8类型的偏置;其中,int8类型的偏置包括高位int8类型的偏置和低位int8类型的偏置; 根据向量减法指令,计算所述低位int8类型的权重和所述低位int8类型的偏置的int8类型的第一差数据; 调用数据类型转换指令,将所述第一差数据中低256bit数据转换为fp16类型的第一低位数据,并存储fp16类型的第一低位数据; 根据移位指令,将所述第一差数据右移256bit,并将右移后的第一差数据转换为fp16类型的第一高位数据,并存储fp16类型的第一高位数据; 根据向量减法指令,计算所述高位int8类型的权重和所述高位int8类型的偏置的int8类型的第二差数据; 调用数据类型转换指令,将所述第二差数据中低256bit数据转换为fp16类型的第二低位数据,并存储fp16类型的第二低位数据; 根据移位指令,将所述第二差数据右移256bit,并将右移后的第二差数据转换为fp16类型的第二高位数据,并存储fp16类型的第二高位数据; 计算fp16类型的量化系数与其对应的fp16类型的数据的乘积,将各乘积值作为各组对应的反量化结果,并存储各组对应的反量化结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215100 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励