上海壁仞科技股份有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海壁仞科技股份有限公司申请的专利注意力机制计算的优化方法、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120087414B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510576855.7,技术领域涉及:G06N3/045;该发明授权注意力机制计算的优化方法、设备、存储介质及程序产品是由请求不公布姓名设计研发完成,并于2025-04-30向国家知识产权局提交的专利申请。
本注意力机制计算的优化方法、设备、存储介质及程序产品在说明书摘要公布了:本申请实施例提供了一种注意力机制计算的优化方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:基于查询分块和键分块执行前向重计算算子获得前向归一化结果。基于输出梯度分块和前向归一化结果执行第一矩阵乘算子获得值中间结果,同时并行基于前向输出分块和输出梯度分块执行点乘求和算子,获得中间张量。对值中间结果执行第一类型变换算子,获得值梯度分块;同时并行基于输出梯度分块、值分块、中间张量和前向归一化结果执行梯度反向传播算子,获得反向归一化结果。最后基于反向归一化结果、键分块和查询分块,获得查询梯度分块和键梯度分块,实现对不同算子做有效的流水线处理,从而提升注意力机制计算的整体性能。
本发明授权注意力机制计算的优化方法、设备、存储介质及程序产品在权利要求书中公布了:1.一种注意力机制计算的优化方法,其特征在于,包括: 基于查询分块和键分块执行前向重计算算子,获得前向归一化结果; 基于输出梯度分块和所述前向归一化结果执行第一矩阵乘算子,获得值中间结果;对所述值中间结果执行第一类型变换算子,获得值梯度分块; 基于前向输出分块和所述输出梯度分块执行点乘求和算子,获得中间张量;所述点乘求和算子与所述第一矩阵乘算子是并行执行的; 基于所述输出梯度分块、值分块、所述中间张量和所述前向归一化结果执行梯度反向传播算子,获得反向归一化结果,所述梯度反向传播算子和所述第一类型变换算子是并行执行的; 基于所述反向归一化结果和所述键分块,获得查询梯度分块;以及,基于所述反向归一化结果和所述查询分块,获得键梯度分块; 所述前向重计算算子包括:第二矩阵乘算子和归一化算子;所述基于查询分块和键分块执行前向重计算算子,获得前向归一化结果,包括: 将所述查询分块划分为多个第一子分块;以及,将所述键分块划分为多个第二子分块,其中,每个第一子分块对应一个第二子分块; 针对每个第一子分块以及对应的第二子分块,分别执行:通过张量核基于一个第一子分块和对应的第二子分块执行第二矩阵乘算子,获得子矩阵乘结果;将所述子矩阵乘结果保存在寄存器中;通过矢量核从所述寄存器中读取所述子矩阵乘结果执行所述归一化算子,获得子归一化结果的过程中,所述张量核并行基于下一个子分块执行所述第二矩阵乘算子; 基于获得的多个子归一化结果,生成所述前向归一化结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海壁仞科技股份有限公司,其通讯地址为:201114 上海市闵行区陈行公路2388号16幢13层1302室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。