Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京壁仞科技开发有限公司;上海壁仞科技股份有限公司请求不公布姓名获国家专利权

北京壁仞科技开发有限公司;上海壁仞科技股份有限公司请求不公布姓名获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京壁仞科技开发有限公司;上海壁仞科技股份有限公司申请的专利一种缓存资源复用方法、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118860963B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411336688.0,技术领域涉及:G06F15/78;该发明授权一种缓存资源复用方法、设备、存储介质及程序产品是由请求不公布姓名设计研发完成,并于2024-09-24向国家知识产权局提交的专利申请。

一种缓存资源复用方法、设备、存储介质及程序产品在说明书摘要公布了:本申请实施例提供了一种缓存资源复用方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:对查询表示和键表示进行矩阵乘法计算,获得第一计算结果;将第一计算结果保存在片上高速缓存中的第一缓存区。从第一缓存区读取第一计算结果进行归一化操作获得归一化结果。由于第一计算结果与归一化结果的数据类型相同,且后续注意力机制计算不再需要第一计算结果,而是通过对归一化结果与值表示进行矩阵乘法计算,获得输出张量,因此,可以复用原本保存第一计算结果的第一缓存区来保存归一化结果,这样既保证了注意力机制计算的准确性,同时实现对缓存资源进行复用,有效缓解了算子实现过程中缓存资源使用紧张的状况。

本发明授权一种缓存资源复用方法、设备、存储介质及程序产品在权利要求书中公布了:1.一种缓存资源复用方法,其特征在于,包括: 将查询表示、键表示和值表示从显存加载到片上高速缓存中的组共享内存中;所述查询表示为外循环遍历的多个查询分块中的一个查询分块,所述键表示为所述一个查询分块对应的内循环遍历的多个键分块中的一个键分块,所述值表示为所述一个查询分块对应的内循环遍历的多个值分块中的一个值分块; 将所述查询表示从所述组共享内存加载到片上高速缓存中第一数量的线程本地寄存器,直到所述一个查询表示对应的多轮内循环遍历执行结束; 将查询表示和所述键表示输入第一矩阵乘算子进行矩阵乘法计算,获得第一计算结果;将所述第一计算结果保存在总缓存区中为所述第一矩阵乘算子分配的第一缓存区,所述总缓存区是所述片上高速缓存中为目标融合算子分配的缓存资源,所述第一矩阵乘算子为目标融合算子中的算子,所述第一缓存区为第二数量的线程本地寄存器; 从所述第一缓存区读取所述第一计算结果,并将所述第一计算结果输入归一化算子进行归一化操作,获得归一化结果;在确定所述归一化结果的数据类型与所述第一计算结果的数据类型相同,所述归一化算子为所述目标融合算子中的算子,所述第一计算结果不再使用时,复用所述第一缓存区保存所述归一化结果; 从所述组共享内存中读取所述值表示,与所述归一化结果进行矩阵乘法计算,获得输出张量;所述输出张量为所述一个键分块和所述一个值分块所在的内循环遍历轮次的计算结果,且保存在单独分配的片上高速缓存的第三缓存区。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京壁仞科技开发有限公司;上海壁仞科技股份有限公司,其通讯地址为:100102 北京市朝阳区京东园四区13号楼-4至33层101内10层201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。