太原理工大学李丹丹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉太原理工大学申请的专利一种基于自适应策略的SpMV在CPU-DCU异构平台的实现方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121009268B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511111551.X,技术领域涉及:G06F17/16;该发明授权一种基于自适应策略的SpMV在CPU-DCU异构平台的实现方法是由李丹丹;郝江洋;王彬设计研发完成,并于2025-08-08向国家知识产权局提交的专利申请。
本一种基于自适应策略的SpMV在CPU-DCU异构平台的实现方法在说明书摘要公布了:本发明属于高性能并行计算领域,具体涉及一种基于自适应策略的SpMV在CPU‑DCU异构平台的实现方法,旨在提升SpMV运算效率。方法包括在CPU端获取稀疏矩阵数据,将稀疏矩阵数据转换为CSR格式,得到CSR格式数组。基于CSR格式数组,对其表示的稀疏矩阵进行自适应分解,得到密集块和稀疏块,基于CSR格式数组构建RDCSR格式数组;RDCSR格式数组包含CSR格式数组及记录密集块行索引的数组和记录稀疏块行索引的数组。将RDCSR格式数组传输至DCU,在DCU端对密集块和稀疏块进行自适应线程分配后,并行执行SpMV计算,得到合并后的计算结果。将合并后的计算结果从DCU传输至CPU,并对SpMV的计算性能进行评估。
本发明授权一种基于自适应策略的SpMV在CPU-DCU异构平台的实现方法在权利要求书中公布了:1.一种基于自适应策略的SpMV在CPU-DCU异构平台的实现方法,其特征在于,包括:S1:在CPU端获取稀疏矩阵数据,将稀疏矩阵数据转换为CSR格式,得到CSR格式数组;S2:基于所述CSR格式数组,对其表示的稀疏矩阵进行自适应分解,得到密集块和稀疏块,基于所述CSR格式数组构建RDCSR格式数组;所述RDCSR格式数组包含所述CSR格式数组及记录密集块行索引的数组和记录稀疏块行索引的数组;S3:将所述RDCSR格式数组传输至DCU,在DCU端对密集块和稀疏块进行自适应线程分配后,并行执行SpMV计算,得到合并后的计算结果;S4:将所述合并后的计算结果从DCU传输至CPU,并对SpMV的计算性能进行评估; 在步骤S2中,对稀疏矩阵进行自适应分解具体包括:将所述稀疏矩阵每行的非零元素左移,统计每行的非零元素数量;以DCU线程束包含的线程数量作为划分阈值,将每行中数量为所述阈值整数倍的非零元素划分为密集块,剩余非零元素划分为稀疏块;其中,所述划分阈值的确定方式为:将DCU中一个线程束所包含的线程数量作为所述划分阈值,用于区分密集块和稀疏块的非零元素数量界限; 在步骤S2中,构建密集块行索引数组和稀疏块行索引数组,分别记录密集块和稀疏块对应的行索引;将所述CSR格式数组与所述密集块行索引数组、稀疏块行索引数组合并,形成所述RDCSR格式数组; 在步骤S3中,基于所述密集块行索引数组,为所述密集块的每行分配一个线程束,所述线程束内的线程与密集块的非零元素一一对应; 在步骤S3中,对稀疏块进行自适应线程分配具体包括:基于所述稀疏块行索引数组及稀疏块的非零元素总数,计算稀疏块每行所需分配的线程数量;按照所述计算得到的线程数量,为所述稀疏块的每行分配对应数量的线程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人太原理工大学,其通讯地址为:030024 山西省太原市迎泽大街79号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励