贵州师范大学吕健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州师范大学申请的专利基于CUDA并行计算架构对折叠进行GPU并行化的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116051355B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310003422.3,技术领域涉及:G06T1/20;该发明授权基于CUDA并行计算架构对折叠进行GPU并行化的方法是由吕健;谢晓尧;于徐红设计研发完成,并于2023-01-03向国家知识产权局提交的专利申请。
本基于CUDA并行计算架构对折叠进行GPU并行化的方法在说明书摘要公布了:本发明公开了基于CUDA并行计算架构对折叠进行GPU并行化的方法,包括以下步骤:步骤S1、基于gperftools做性能分析;步骤S2、分析数据依赖性;步骤S3、基于CUDA的GPU并行。本发明基于CUDA并行计算架构对折叠进行GPU并行化,在并行之前对折叠先进行优化,消除其中的数据循环依赖并且重构目标函数,重写CUDA核函数在GPU上实现折叠并取得良好的效果。
本发明授权基于CUDA并行计算架构对折叠进行GPU并行化的方法在权利要求书中公布了:1.基于CUDA并行计算架构对折叠进行GPU并行化的方法,其特征在于,包括以下步骤: 步骤S1、基于gperftools做性能分析,具体包括以下步骤: S11、链接库,安装gperftools会附带库环境; S12、运行需要做性能分析的代码,基于gperftools会对运行的代码进行性能分析,并输出结果; S13对这个输出的结果做分析运算,得到其中各个函数在性能分析中所占的比例,生成可读的文本和图片结果,根据性能分析结果,定位优化的目标是combine_profs函数,该函数用于优化折叠的方向; 步骤S2、分析数据依赖性,数据依赖性分为两种,在一次循环迭代中前后之间的依赖称为数据依赖;在不同次循环迭代间的依赖称为循环依赖,即前一次迭代中计算的结果,会在后续的迭代中使用; 在并行时,有数据依赖关系的会被分配到用一个计算资源上执行,并不会产生错误歧义; 有循环依赖的是不同次的迭代,因此有可能会分配到不同的计算资源上,而此时因为缺少之前的迭代的结果,本次迭代中的计算会产生错误结果,从而依次影响后续的迭代,导致最终的计算错误,在对折叠做并行之前,需要分析并消除数据循环依赖性; 步骤S3、基于CUDA的GPU并行,串行折叠中的combine_prof函数是在四重循环里面调用的,在计算数据的时候,是在计算机上重复执行四重循环次数个combine_profs函数,而基于CUDA的GPU并行,在消除了数据循环依赖的基础上,把四重循环次数个gpu_conbine_profs函数发送到GPU的核上计算,同时可以在GPU的核上调用多个函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州师范大学,其通讯地址为:550001 贵州省贵阳市宝山北路116号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励