平头哥(上海)半导体技术有限公司李书森获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平头哥(上海)半导体技术有限公司申请的专利处理单元、相关装置和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113688982B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010427312.6,技术领域涉及:G06N3/063;该发明授权处理单元、相关装置和方法是由李书森;蔡智设计研发完成,并于2020-05-19向国家知识产权局提交的专利申请。
本处理单元、相关装置和方法在说明书摘要公布了:本公开提供了一种处理单元、相关装置和方法。该处理单元,包括:取指令单元;指令译码单元;指令执行单元,用于:在深度学习模型的静态图中提取常量子图,其中,所述常量子图是在假定所述深度学习模型的输入张量具有固定形状的前提下输出值为常量的节点组成的连通子图;将满足所述固定形状的任一张量,作为输入张量输入所述静态图,获取所述常量子图的出口节点输出的常量;以获取的常量构造常量节点,用所述常量节点取代所述深度学习模型中的所述常量子图,形成第二深度学习模型。本公开实施例进一步减少了深度学习模型运行时在处理单元和加速单元之间传输的数据量,提高了深度学习模型的执行效率。
本发明授权处理单元、相关装置和方法在权利要求书中公布了:1.一种处理单元,用于确定适于计算装置中加速单元运行的模型,其中,所述处理单元包括: 取指令单元,用于从所述处理单元外部的存储器取回计算机指令; 指令译码单元,用于对取回的计算机指令进行译码; 指令执行单元,用于执行译码后的所述计算机指令,以实现: 在深度学习模型的静态图中提取常量子图,其中,所述常量子图是在假定所述深度学习模型的输入张量具有固定形状的前提下输出值为常量的节点组成的连通子图; 将满足所述固定形状的任一张量,作为输入张量输入所述静态图,获取所述常量子图的出口节点输出的常量,所述出口节点是指所述常量子图中的、输出端指向所述常量子图的外部节点且输入端为所述常量子图的内部节点的节点; 以获取的常量构造常量节点,用所述常量节点取代所述深度学习模型中的所述常量子图,形成第二深度学习模型,以减少模型实际运行时在处理单元和加速单元之间传输的数据量; 所述指令执行单元还用于执行译码后的所述计算机指令,以实现:在形成第二深度学习模型后,将第二深度学习模型转换成通用中间表达; 在将第二深度学习模型转换成通用中间表达后,在所述通用中间表达中插入最大最小值收集节点,用于收集待量化输入的最大值、最小值;将插入了所述最大最小值收集节点的通用中间表达转换回特定格式进行校准,得到所述待量化输入的最大值、最小值;根据得到的待量化输入的最大值、最小值,在所述通用中间表达中插入量化和反量化节点;将插入了量化节点和反量化节点的通用中间表达转换回特定格式,得到量化后模型; 在得到量化后模型后,将所述量化后模型按照加速单元支持的指令集,转换成加速单元模型,发送给所述加速单元; 其中,所述加速单元为加速深度学习模型的运算处理速度而设计的单元。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平头哥(上海)半导体技术有限公司,其通讯地址为:200131 上海市浦东新区中国(上海)自由贸易试验区上科路366号、川和路55弄2号5层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。