中国人民解放军国防科技大学姜晶菲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119045887B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411049828.6,技术领域涉及:G06F9/30;该发明授权一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法及装置是由姜晶菲;李娅琳;许金伟;苏华友;王庆林;高蕾;李荣春;乔鹏设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。
本一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法及装置在说明书摘要公布了:本申请公开了一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法及装置。根据矩阵的维度和计算核的个数,构建了三种多核并行模式,适用于多种计算场景,充分利用了向量处理器的多核架构。同时减少了部分矩阵维度规格下的计算冗余,提高了稀疏矩阵乘法计算的并行度,有助于发挥向量处理器的计算性能。各多核并行模式为将多个计算核在权值矩阵和稠密输入矩阵的各维度上并行,将稀疏矩阵乘法在不同维度分核并行实现。基于两矩阵的维度规格,获取在每个多核并行模式下进行稀疏矩阵乘法计算的理论计算效率。再选择理论计算效率最大的多核并行模式进行稀疏矩阵乘法计算。如此能够自动适配性能最优的模式执行计算,通用性高,且提升了计算效率。
本发明授权一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法及装置在权利要求书中公布了:1.一种面向向量处理器的半精度稀疏矩阵乘法多核并行的方法,其特征在于,稀疏矩阵乘法为按稀疏格式压缩后的权值矩阵与稠密输入矩阵进行乘法计算,得到稠密输出矩阵的过程,所述方法包括: 根据矩阵维度和计算核的个数,构建多个多核并行模式;所述矩阵维度为矩阵中的行数和列数,其中,所述权值矩阵的矩阵维度为[M][K],所述稠密输入矩阵的矩阵维度为[K][N],所述稠密输出矩阵的矩阵维度为[M][N];所述多核并行模式包括第一模式、第二模式和第三模式;所述第一模式为各所述计算核在所述权值矩阵的M维上并行;所述第二模式为各所述计算核在所述稠密输入矩阵的N维上并行;所述第三模式为各所述计算核在所述M维和所述N维上同时并行; 基于M和N的数值,获取在每个所述多核并行模式下进行稀疏矩阵乘法计算的理论计算效率; 选择理论计算效率最大的多核并行模式进行稀疏矩阵乘法计算; 所述多核并行模式为所述第一模式时,所述计算核为8个,所述根据矩阵维度和计算核的个数,构建多个多核并行模式,包括: 将各所述计算核在所述权值矩阵上平均分配,构建所述第一模式;其中,每个所述计算核对应的所述权值矩阵的行数为八分之一M的向上取整,每个所述计算核对应的所述权值矩阵的列数为K; 所述获取在每个所述多核并行模式下进行稀疏矩阵乘法计算的理论计算效率,包括: 获取所述矩阵维度在所述第一模式下的理论计算效率如下式: ; 式中,M_ratio为所述第一模式的理论计算效率,mb为预设的所述M维的分块大小,nb为预设的所述N维的分块大小。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励