北京航空航天大学肖利民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种基于聚合标签阵列的GPU共享L1缓存获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116611992B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310213772.2,技术领域涉及:G06T1/60;该发明授权一种基于聚合标签阵列的GPU共享L1缓存是由肖利民;徐向荣;王良;张翼翔;郭骐宁;韩萌;谢喜龙;刘浩设计研发完成,并于2023-03-07向国家知识产权局提交的专利申请。
本一种基于聚合标签阵列的GPU共享L1缓存在说明书摘要公布了:本发明公开了一种基于聚合标签阵列的GPU共享L1缓存。本发明的主要目的是基于聚合标签阵列的方式,对GPU共享L1缓存进行优化,使得GPU共享L1缓存在充分利用核间局部性的同时,降低L1缓存资源争用,提升GPU缓存处理访存请求的并行度,从而提升GPU共享L1缓存的性能。与同类型GPU共享缓存优化方法相比,本发明在不增大L2缓存访存关键路径的同时,极大地降低了L1缓存由于共享导致的资源争用。
本发明授权一种基于聚合标签阵列的GPU共享L1缓存在权利要求书中公布了:1.一种基于聚合标签阵列的GPU共享L1缓存装置,其特征在于,由以下各部分组成:与L1缓存解耦合后的GPU核心;聚合L1缓存标签阵列,用于存储数据阵列的数据标签;请求分发器,用于将请求分发到指定的L1缓存数据阵列;L1缓存数据阵列,用于存储L1缓存中的数据;片上网络,用于将上述组件互连;通过基于聚合标签阵列的方式,对GPU共享L1缓存进行优化,使得GPU共享L1缓存在充分利用核间局部性的同时,降低L1缓存资源争用,提升GPU缓存处理访存请求的并行度,从而提升GPU共享L1缓存的性能; 所述基于聚合标签阵列的GPU共享L1缓存完成请求访存的过程包括:GPU核心发出请求后,请求首先进入聚合标签阵列,在聚合标签阵列中,进行标签比较,经过比较后即可得知该请求访存数据在数据阵列中的位置;然后,请求到达请求分发器,由请求分发器确定目标数据阵列;请求在到达源GPU核所对应的本地数据阵列后,通过数据阵列之间的片上网络,访问目标数据阵列;在完成访问后,回到本地数据阵列,并通过本地数据阵列与GPU核心之间的连接,返回GPU核心; 所述基于聚合标签阵列的GPU共享L1缓存中,将L1缓存中标签阵列与数据阵列解耦合;其中多个L1缓存解耦合后得到的标签阵列聚合在一起,称为聚合L1缓存标签阵列;每个L1缓存去除标签阵列后,剩余部分称为数据阵列; 所述聚合L1缓存标签阵列中,每个缓存组的标签阵列在单独的缓存存储体中,以减少缓存存储体冲突;每个标签阵列中的每一路标签经过标签选择器后与比较器相连;一个由N个标签阵列聚合形成的聚合标签阵列最多可以并行处理N个GPU核的访存请求;每个请求通过地址解析确定组编号后,将组编号输入到标签选择器,由标签选择器选择所有标签阵列中对应组的缓存标签,并将缓存标签传入标签比较器;请求中的地址标签与缓存标签在标签比较器中比较,如果一致,并且有效位为真,则表示缓存命中,反之,缓存未命中;聚合L1缓存标签阵列的重要特征是支持多个访存请求并行地与多个标签阵列中的标签比较;因此,来源于GPU核心的请求不仅可以探知本地数据阵列中是否缓存了请求数据,还可以同时探知其他数据阵列中是否缓存了请求数据,进而访问已缓存请求数据的数据阵列;所述L1缓存数据阵列与传统L1缓存数据阵列一致,用来缓存数据,并可以通过缓存标签比较结果,取出正确的访存数据,发送至GPU核心。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励