重庆大学黎勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利一种基于编码分布式计算的卷积神经网络卷积层加速方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119514606B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411553774.7,技术领域涉及:G06N3/0464;该发明授权一种基于编码分布式计算的卷积神经网络卷积层加速方法是由黎勇;谭硕;刘锐设计研发完成,并于2024-11-03向国家知识产权局提交的专利申请。
本一种基于编码分布式计算的卷积神经网络卷积层加速方法在说明书摘要公布了:本发明属于分布式计算和卷积神经网络技术领域,具体涉及一种基于编码分布式计算的卷积神经网络卷积层加速方法。本发明的技术方案采用主从式分布计算架构,包括,对卷积层的输入张量和核张量进行切分,并利用多项式编码技术生成包含冗余信息的子张量;将所述编码子张量分配至各从节点进行本地存储和并行卷积计算;主节点通过接收最先返回的部分计算结果,即可恢复得到当前卷积层的完整输出。本发明通过引入编码计算和优化切分策略,在保证计算正确性的前提下,实现了以下技术效果:其一,降低了分布式系统的通信和存储开销;其二,提升了卷积运算的并行计算效率;其三,增强了系统抵抗节点掉队的容错能力。
本发明授权一种基于编码分布式计算的卷积神经网络卷积层加速方法在权利要求书中公布了:1.一种基于编码分布式计算的卷积神经网络卷积层加速方法,其特征在于,包括以下步骤: 步骤1:主节点确定用于计算的从节点数量n、节点数恢复阀值k,以及冗余节点数量n-k;然后,对待加速的卷积层参数进行配置,设定卷积长s,并使用原有卷积层参数定义三维输入张量其中C为输入通道数,H为输入张量高度,W为输入张量宽度,以及定义四维卷积核张量其中N为输出通道数,C为输入通道数,KH为核高度,KW为核宽度,并为n个从节点分配编号i∈{1,2,3,...,n}; 步骤2:主节点数据准备阶段,具体包括以下子步骤: 步骤2-1:主节点根据分布式系统通信和存储成本的需求,以及该卷积层的输入张量和核张量的规模,确定当前卷积层对每个工作节点的最优切分方案,得到输入张量X和核张量K的切分数量kA和kB; 步骤2-2:主节点根据最优切分方案,将张量X沿高维度或宽维度连续划分为kA个有相互覆盖部分的子张量X′i,并将张量K按输出通道维度等分为kB个子张量K′i; 步骤2-3:主节点利用线性编码矩阵GA和GB,对kA个输入子张量和kB个核子张量分别进行n次线性组合得到n个编码输入子张量和n个编码核子张量同时将生成的编码子张量分发给与之对应的n个节点,各从节点将得到编码输入子张量和编码核子张量各一个; 步骤3:编号为i的从节点在得到分配的编码输入子张量和编码核子张量后,完成卷积运算并将计算结果立即返回主节点; 步骤4:主节点进行数据恢复和拼接阶段,具体包括以下子步骤: 步骤4-1:主节点接收并存储最先返回的k个卷积结果,这些结果对应的节点编号构成集合随后,主节点根据集合结合编码矩阵GA和GB,构建解码矩阵GC; 步骤4-2:主节点根据解码矩阵GC,对收到的k个编码张量结果进行k次线性组合得到k个解码输出子张量Y1,Y2,...,Yk; 步骤4-3:主节点通过沿H或W维度以及N维度,将k个恢复出的输出子张量进行拼接,得到完整的卷积结果张量Y,并将其用于后续的神经网络计算。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励