苏州元脑智能科技有限公司黄伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利模型推理加速方法、系统、电子设备、存储介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120258152B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510724702.2,技术领域涉及:G06N5/04;该发明授权模型推理加速方法、系统、电子设备、存储介质及产品是由黄伟;朱克峰;王彦伟;李仁刚设计研发完成,并于2025-05-30向国家知识产权局提交的专利申请。
本模型推理加速方法、系统、电子设备、存储介质及产品在说明书摘要公布了:本申请公开了一种模型推理加速方法、系统、电子设备、存储介质及产品,涉及人工智能技术领域,包括获取第一计算模块中序列化模型的中间变量,中间变量包括键值副本、中间层潜在特征和深层输出特征中至少一项,中间层潜在特征为第一计算模块和第二计算模块中相似度不低于预设相似阈值的特征,中间层潜在特征是由第一计算模块中浅层计算块确定的,深层输出特征是由第一计算模块中深层计算块确定的;确定相似度不低于预设相似阈值的特征为第二计算模块中深层计算块的输入,以使第二计算模块得到序列化模型的预测结果,解决了相关方案中缓存快速膨胀,导致模型推理速度慢的技术问题,达到了减少冗余计算,进而加快模型推理的速度的技术效果。
本发明授权模型推理加速方法、系统、电子设备、存储介质及产品在权利要求书中公布了:1.一种模型推理加速方法,其特征在于,包括: 获取第一计算模块中序列化模型的中间变量,所述中间变量包括键值副本、中间层潜在特征和深层输出特征中至少一项,所述中间层潜在特征为所述第一计算模块和第二计算模块中相似度不低于预设相似阈值的特征,所述相似度不低于预设相似阈值的特征用于确定可以在不同计算模块之间复用的特征,所述中间层潜在特征是由所述第一计算模块中浅层计算块确定的,所述深层输出特征是由所述第一计算模块中深层计算块确定的; 确定所述相似度不低于预设相似阈值的特征为所述第二计算模块中深层计算块的输入,以使所述第二计算模块得到所述序列化模型的预测结果; 获取所述第二计算模块中序列化模型的高频占比; 响应于所述序列化模型的高频占比不低于预设高频占比,确定所述序列化模型中目标时间步,所述目标时间步用于区分中间层潜在特征复用的时间步和全量计算的时间步,所述全量计算包括所述第二计算模块中的浅层计算块计算和深层计算块计算。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215103 江苏省苏州市吴中经济开发区综保区经一路1号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。