贵州财经大学邓明森获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州财经大学申请的专利一种基于ARM架构的矩阵计算自适应优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120744299B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511222018.0,技术领域涉及:G06F17/16;该发明授权一种基于ARM架构的矩阵计算自适应优化方法及系统是由邓明森;陈琪;陈旭;蒋真设计研发完成,并于2025-08-29向国家知识产权局提交的专利申请。
本一种基于ARM架构的矩阵计算自适应优化方法及系统在说明书摘要公布了:本发明公开了一种基于ARM架构的矩阵计算自适应优化方法及系统,包括:对待处理矩阵数据进行预处理;对预处理后的矩阵数据进行局部活跃度计算和热点区域识别,确定矩阵的长尾分布特征;基于矩阵的长尾分布特征和处理器信息中多级缓存容量参数,计算矩阵的最优分块大小范围,生成非对称分块方案;基于非对称分块方案,建立矩阵特征与最优分块参数的映射关系;基于非对称分块方案和映射关系,计算各分块的计算密度和内存访问模式,生成任务调度方案;基于任务调度方案,在处理器上执行矩阵计算,输出最终计算结果。本发明通过识别矩阵的长尾分布特性,实现自适应分块和异构核心调度,提高矩阵计算在ARM上的性能和能效。
本发明授权一种基于ARM架构的矩阵计算自适应优化方法及系统在权利要求书中公布了:1.一种基于ARM架构的矩阵计算自适应优化方法,其特征在于,包括: 获取待处理矩阵数据和ARM处理器信息,对所述待处理矩阵数据进行预处理,得到预处理后的矩阵数据; 对所述预处理后的矩阵数据进行局部活跃度计算和热点区域识别,确定矩阵的长尾分布特征; 基于所述矩阵的长尾分布特征和所述ARM处理器信息中多级缓存容量参数,计算矩阵的最优分块大小范围,生成非对称分块方案,包括: 获取全局活跃度的统计分布数据和局部活跃度的统计分布数据,对活跃度超过第三预设阈值的区域设计适配L1缓存的分块,并对活跃度低于第四预设阈值的区域设计适配L2L3缓存的分块,得到初始分块方案; 基于所述初始分块方案,识别跨分块热点区域,通过重叠切割确保热点元素完整包含在单一分块内,并输出分块边界数据; 获取所述分块边界数据,执行内存对齐优化,确保分块边界对齐到缓存行; 获取历史执行数据,根据执行效率指标微调分块大小和形状; 基于所述非对称分块方案,采集各分块的执行时间和缓存命中率,建立矩阵特征与最优分块参数的映射关系,其中,所述分块为所述预处理后的矩阵数据划分的基础子块;所述建立矩阵特征与最优分块参数的映射关系包括: 获取分块执行数据,采集各分块的执行时间、缓存命中率和指令吞吐量; 获取性能指标,分析所述分块执行数据与所述性能指标间的相关性; 获取所述分块执行数据与所述性能指标间的相关性数据,建立矩阵特征与最优分块参数的映射关系模型; 将所述映射关系模型部署到ARMTrustZone环境中,更新分块策略历史库; 获取历史库数据,记录不同矩阵特征下的最优分块参数; 基于所述非对称分块方案和所述矩阵特征与最优分块参数的映射关系,计算各分块的计算密度和内存访问模式,生成任务调度方案; 基于所述任务调度方案,在ARMbig.LITTLE架构的处理器上执行矩阵计算,输出最终计算结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州财经大学,其通讯地址为:550000 贵州省贵阳市花溪区贵州财经大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励