Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天津大学毕重科获国家专利权

天津大学毕重科获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天津大学申请的专利一种面向CPU-DCU架构的天文证认计算访存优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119960984B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510040418.3,技术领域涉及:G06F9/50;该发明授权一种面向CPU-DCU架构的天文证认计算访存优化方法是由毕重科;苏硕;于策;孙超;肖健;杨斌;颜纪伟;原雨豪;肖浩翔设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。

一种面向CPU-DCU架构的天文证认计算访存优化方法在说明书摘要公布了:本发明公开了一种面向CPU‑DCU架构的天文证认计算访存优化方法,步骤为:S1、将待证认的星表A和星表B的天体数据进行网格化处理,并分别以星表‑条带‑网格的层次向量化,记录各网格的边界信息;S2、根据各DCU的最大线程并发数,将星表A和星表B中的天体数据以条带为单位,划分为对应各DCU的多个传输子任务;S3、设定DCU中单个线程的计算任务;S4、设定kernel函数,使DCU的每个线程通过执行kernel函数完成证认计算;S5、采用步骤S4的方法对星表A与星表B中天体之间的证认计算;该方法在保证计算精度和完整性的同时,提高天文网格化计算在DCU上的访存性能,实现整体计算性能的提升。

本发明授权一种面向CPU-DCU架构的天文证认计算访存优化方法在权利要求书中公布了:1.一种面向CPU-DCU架构的天文证认计算访存优化方法,其特征在于,步骤如下: S1、将待证认的星表A和星表B的天体数据进行网格化处理,并分别以星表-条带-网格的层次向量化,记录各网格的边界信息; S2、根据各DCU的最大线程并发数,将星表A和星表B中的天体数据以条带为单位,划分为对应各DCU的多个传输子任务,并设定各传输子任务由CPU控制,自主机端内存传入DCU全局内存中的传输机制为:DCU进行当前传输子任务的天体数据的证认计算时,CPU能够控制自主机端内存向DCU全局内存传输下一个传输子任务对应的天体数据; 其中,对各DCU的多个传输子任务的划分步骤为: S201、确定每个DCU的最大线程并发数threadmax,计算公式为: threadmax=numCU×numSIMD×numwavefront×X, 式中,numCU为计算单元的数量,numSIMD为每个计算单元中SIMD的数量,numwavefront为矢量计算单元的数量,X为矢量计算单元大小,即矢量计算单元上运行的线程数量; S202、根据DCU的数目ndcu和最大线程并发数threadmax,对需要传入DCU计算的数据进行划分: S2021、确定星表中每个条带内的天体数量numi、全部条带内的天体的数量之和numsum和条带数量numc,以及每个DCU的最大线程并发数Sj、全部DCU的线程并发数之和Ssum、和DCU的数目ndcu,其中,每个DCU的最大线程并发数Sj代入由步骤S301计算得到的结果threadmax; S2022、按照各DCU的最大线程并发数Sj由高到低分配条带,直到首次满足条件: 式中,start和end分别为分配至DCU上的多条条带中第一个条带的序号和最后一个条带的序号; S203、对于分配至每个DCU的多条条带,根据设定的子任务规模,将多条条带按照条带的排列顺序依次划分为多个传输子任务,以分批次传输至DCU中; S3、设定DCU中单个线程的计算任务为:星表A中每个天体对应一个线程,使线程负责星表A中天体与星表B中位于同一网格及全部相邻网格内所有天体的证认计算; S4、设定kernel函数,使DCU的每个线程通过执行kernel函数完成证认计算;kernel函数对天体数据的处理过程设定为: 1创建一个用于存储星表B内天体数据的共享内存,以使线程束内部的线程复用共享内存中的同一份数据; 2根据线程束内首个线程分配的星表A中天体的所属网格,确定星表B中待调用网格的左边界,根据线程束内末尾线程分配的星表A中天体的所属网格,确定星表B中待调用网格的右边界; 3设定双缓冲机制,将星表B中由步骤2确定的天体数据分批次从DCU的全局内存中加载至共享内存的同时,已加载至共享内存中的天体数据进行证认计算; S5、采用步骤S4设定的证认计算机制,完成星表A与星表B中天体之间的证认计算。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300073 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。