东南大学苏州研究院刘昊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学苏州研究院申请的专利基于脉动阵列的高吞吐量目标检测加速器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116136798B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310260292.1,技术领域涉及:G06F9/50;该发明授权基于脉动阵列的高吞吐量目标检测加速器是由刘昊;朱月设计研发完成,并于2023-03-17向国家知识产权局提交的专利申请。
本基于脉动阵列的高吞吐量目标检测加速器在说明书摘要公布了:本发明公开了一种基于脉动阵列的高吞吐量目标检测加速器,该加速器包括:输入特征图寄存单元1、输入特征图读写缓存单元2、脉动阵列计算部分3、权重读写缓存单元4、池化单元5、输出结果读写缓存单元6以及全局配置单元7;它不仅简化了卷积计算和硬件复杂的数据流设计,而且引入了设计空间探索的步骤,保证了硬件的高资源利用率和高吞吐量。在脉动阵列的计算单元中引入了流水线技术,使得该架构能够提高计算并行度,并使用混合数据复用策略减少带宽压力。该加速器的核心是通过设计空间探索动态寻找脉动阵列的最佳规模,使目标检测算法能够充分利用给定FPGA的硬件资源。
本发明授权基于脉动阵列的高吞吐量目标检测加速器在权利要求书中公布了:1.一种基于脉动阵列的高吞吐量目标检测加速器,其特征在于:该加速器包括:输入特征图寄存单元1、输入特征图读写缓存单元2、脉动阵列计算部分3、权重读写缓存单元4、池化单元5、输出结果读写缓存单元6以及全局配置单元7;其中全局配置单元7的输出分别连接输入特征图寄存单元1、输入特征图读写缓存单元2、权重读写缓存单元4、池化单元5、输出结果读写缓存单元6;输入特征图寄存单元1的输出连接输入特征图读写缓存单元2,输入特征图读写缓存单元2的输出连接脉动阵列计算部分3;权重读写缓存单元4的输出分别连接脉动阵列计算部分3;池化单元5的输入连接脉动阵列计算部分3;池化单元5的输出连接输出结果读写缓存单元6;在基于脉动阵列的高吞吐量目标检测加速器中实现YOLOv2-Tiny目标检测; 所述的高吞吐量目标检测加速器,其工作模式为:将存在加速器外部内存中的输入特征图通过AXI4-Stream总线传输到输入特征图寄存单元1,然后全局配置单元7控制单元将输入特征图寄存单元1中的值配置成脉动阵列所需要的形式存入输入特征图读写缓存单元2中,最后依次输出到脉动阵列的每一行进行计算;通过AXI4-Stream总线传输权重数据到权重读写缓存单元4,然后每一列依次输出权重数据到脉动阵列与脉动阵列行输入的数据进行卷积计算;每个计算单元的结果向上一个计算单元传递,第一层的计算结果将在池化单元5中进行完池化操作后按设计的数据排布方式存入输出结果读写缓存单元6,最终通过AXI4-Stream总线传输输出结果到加速器外的内存中; 所述的脉动阵列计算部分3,依次选取YOLOv2-Tiny目标检测算法的每一层输入数据,权重数据和输出数据,记输出数据的三维规模为R行C列M通道,权重数据的四维规模为K行K列N通道M块,因此YOLOv2-Tiny目标检测算法该层的计算操作数Ops为公式1, Ops=2×R×C×M×N×K×K公式1 对输出数据进行分块,记Tm为通道的分块尺寸,Tr为行分块尺寸,Tc为列分块尺寸,总分块数Blocks和计算每一块的所需要的时间Timeperblock如公式2,公式3, Timeperblock=K×K×N+Tr+Tc-1公式3 记Bin、Bw、Bout分别为计算一块输出数据时,所需要的输入特征图寄存单元,权重读写缓存单元和输出结果读写缓存单元的大小,S为卷积计算的滑动窗口步长,分别如公式4-1,4-2,4-3, Bin=N×S×Tr+K-S×S×Tc+K-S公式4-1 Bw=K×K×N×Tm公式4-2 Bout=Tr×Tc×Tm公式4-3 记αin为计算完一层所有块的输出数据时,输入数据经AXI4-Stream总线从加速器外部传输到加速器内部输入特征图寄存单元1需要搬运的次数,αw为计算完一层所有块的输出数据时,权重数据经AXI4-Stream总线从加速器外部传输到加速器内部权重读写缓存单元4需要搬运的次数,αout为计算完一层所有块的输出数据时,输出数据经AXI4-Stream总线从加速器内部输出结果读写缓存单元6传输到加速器外部需要搬运的次数,分别如公式5-1,5-2,5-3, 采用roofline模型可计算YOLOv2-Tiny的计算性能Performance和操作强度CTC分别如公式6和7; 通过对公式6中Tr、Tc和Tm进行枚举,并在公式7的约束下,得到最合适YOLOv2-Tiny目标检测算法的脉动阵列规模。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学苏州研究院,其通讯地址为:215000 江苏省苏州市苏州工业园区林泉街399号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。