恭喜北京麟卓信息科技有限公司钟阳宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京麟卓信息科技有限公司申请的专利一种基于算子目标值回归预测的智能模型优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119918590B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510405296.3,技术领域涉及:G06N3/0464;该发明授权一种基于算子目标值回归预测的智能模型优化方法是由钟阳宇;杜凯;温研;刘忠新;邓强;季欣然设计研发完成,并于2025-04-02向国家知识产权局提交的专利申请。
本一种基于算子目标值回归预测的智能模型优化方法在说明书摘要公布了:本发明公开了一种基于算子目标值回归预测的智能模型优化方法,通过构建算子结构图,基于图分析的方式对待优化智能模型进行融合处理,再基于构建的算子平台匹配度模型根据算子的类型、参数量、输入维度集合及输入形状集合筛选出各算子中具有最高匹配度的输入数据的输入形状及维度顺序形成第一优化模型,再对第一优化模型进行维度重排及并行化处理完成智能模型的优化,有效减小了模型的规模,降低了存储需求与计算成本。
本发明授权一种基于算子目标值回归预测的智能模型优化方法在权利要求书中公布了:1.一种基于算子目标值回归预测的智能模型优化方法,其特征在于,具体包括以下步骤: 步骤1、为待优化智能模型中的算子设置编号提取分支路线,获取各分支路线中可融合的算子组合,将该算子组合替换为融合算子,完成待优化智能模型的融合得到中间模型; 步骤2、将中间模型中各算子的类型、参数量、输入维度集合及输入形状集合作为输入数据,采用算子平台匹配度模型计算输入数据得到输出数据,输出数据包括算子执行时间、显存使用量、显存带宽利用率、共享内存使用量及寄存器使用量;根据输出数据筛选出各算子中具有最高匹配度的输入形状及维度顺序,形成第一优化模型; 步骤3、遍历第一优化模型中各算子,判断其与相邻算子之间的输入形状一致性,对于不一致的情况在相邻算子之间进行维度重排; 步骤4、由第一优化模型中位于分支节点的算子构成分支算子集合,在分支算子集合中,对于父节点算子相同、算子类型相同且所占显存使用量之和不大于平台显存的多个分支算子,将其对应的分支路线标注为可并行执行的路线,完成待优化智能模型的优化; 所述步骤1中所述获取各分支路线中可融合的算子组合,将该算子组合替换为融合算子的方式为: 步骤1.1、遍历待优化智能模型获取所有节点,确定节点类型及分支节点的分支数量,建立保存所有节点的第一节点集合; 步骤1.2、创建起点队列和终点队列,起点队列用于从待优化智能模型的起始节点开始搜索,将起始节点添加到起点队列;终点队列用于从待优化智能模型的终止节点开始搜索,将终止节点添加到终点队列;分别从起始节点和终止节点开始逐层扩展到当前节点; 步骤1.3、检查两个队列中的当前节点是否为分支节点,若为分支节点则执行步骤1.4;否则向前扩展到当前节点的相邻节点,以相邻节点为当前节点执行步骤1.3; 步骤1.4、从当前节点开始,回溯到其所在队列的相邻分支节点记为第一分支节点,由当前节点与第一分支节点间的节点形成分支路线;将分支路线中的节点从第一节点集合中删除,并将第一分支节点的分支数量自减1,当分支数量为0时将其从第一节点集合中删除;若当前节点为起始节点或终止节点则结束搜索,否则向前扩展到当前节点的相邻节点,以相邻节点为当前节点执行步骤1.3; 步骤1.5、初始化候选矩阵,候选矩阵的行为融合后目标图的节点、列为待优化智能模型的初始源图的节点;若目标图的节点能够与初始源图的节点相匹配,则候选矩阵中对应点的取值设置为1,否则为0; 步骤1.6、根据邻接矩阵的约束,对目标图中的每个节点与初始源图的节点进行递归匹配,当存在完整的匹配时将初始源图中匹配的节点与边消除替换为算子组合的编号,保留融合算子信息,直到返回无匹配项,无法再进行任何融合操作为止。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京麟卓信息科技有限公司,其通讯地址为:100085 北京市海淀区西三旗昌临801号27号3层310、312;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。