西安电子科技大学彭琪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种可配置的深度可分离卷积硬件加速系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721147B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411634355.6,技术领域涉及:G06N3/063;该发明授权一种可配置的深度可分离卷积硬件加速系统及方法是由彭琪;石文斌;祁仲冬设计研发完成,并于2024-11-15向国家知识产权局提交的专利申请。
本一种可配置的深度可分离卷积硬件加速系统及方法在说明书摘要公布了:本发明公开了一种可配置的深度可分离卷积硬件加速系统及方法,包括:特征图存储buffer和权重存储buffer,用于存储当前卷积网络层的输入和权重;可配置数据流动卷积模块,用于对输入进行深度可分离卷积操作,每一轮对输入特征图的部分通道的数据进行对应的卷积操作;可配置加法树模块,用于对卷积结果累加,将每一轮的卷积结果进行对应的累加;中间结果累加模块,用于将每一轮累加的部分通道的逐点卷积结果与之前轮累加的部分通道的逐点卷积结果累加,直到所有输入通道全部累加完成输出结果;累加结果处理模块,用于处理卷积累加结果,得到当前卷积层的输出。本发明通过主要计算模块的可配置性大大减少了设计的面积及资源的开销。
本发明授权一种可配置的深度可分离卷积硬件加速系统及方法在权利要求书中公布了:1.一种可配置的深度可分离卷积硬件加速系统,其特征在于,包括: 特征图存储buffer和权重存储buffer,用于分别存储当前深度可分离卷积网络层的第一输入特征图和权重参数; 可配置数据流动卷积模块,用于在深度卷积的数据流动卷积模式下对所述第一输入特征图进行深度卷积操作,得到深度卷积结果;在逐点卷积的数据流动卷积模式下,每一轮对逐点卷积层的第二输入特征图中的c个通道的数据进行逐点卷积操作,得到这一轮的逐点卷积结果; 可配置加法树模块,用于在与深度卷积匹配的输入加法模式下对所述深度卷积结果进行累加,得到深度卷积累加结果;在与逐点卷积匹配的输入加法模式下将每一轮逐点卷积结果进行累加; 中间结果累加模块,用于将每一轮累加的逐点卷积结果与之前轮累加的逐点卷积结果进行累加,直至将所有轮累加的逐点卷积结果进行累加; 累加结果处理模块,用于对所述深度卷积累加结果进行处理,得到深度卷积层的输出特征图;对所述所有轮累加的逐点卷积结果的累加结果进行处理,得到所述当前深度可分离卷积网络层的输出特征图;所述深度卷积层的输出特征图是所述第二输入特征图; 每个可配置数据流动卷积模块包括:移位寄存器阵列、寄存器阵列、乘法器阵列和两个多选一数据选择器; 所述移位寄存器阵列具有三行,第一行和第二行具有M个移位寄存器,第三行具有3个移位寄存器,每一行相邻的两个移位寄存器的输出端与输入端顺次连接;M为大于3的预设正整数;每个移位寄存器用于存储部分特征图数据; 所述寄存器阵列具有三行三列,每一行和每一列均具有三个寄存器,每个寄存器用于存储部分权重参数; 所述乘法器阵列具有三行三列,每一行和每一列均具有三个乘法器; 其中,第i行的第j个移位寄存器的输出端和第i行的第j个寄存器的输出端,均与第i行的第j个乘法器的两个输入端分别连接,其中,i和j均为正整数,并且i和j的取值均为1至3,每个乘法器的第三个输入端还用于接入外部输入的开关信号,一个开关信号用于控制对应的一个乘法器是否处于工作状态;第一个多选一数据选择器的输出端与第二行第一个移位寄存器的输入端连接,第二个多选一数据选择器的输出端与第三行第一个移位寄存器的输入端连接;移位寄存器阵列的第一行中第个寄存器的输出端与所述第一个多选一数据选择器的第1至第P+1个输入端一一连接,移位寄存器阵列的第二行中第个寄存器的输出端与所述第二个多选一数据选择器的第1至第P+1个输入端一一连接,其中,a为整数,且a的取值为0至P,P为大于或等于1的预设正整数,所述移位寄存器阵列的第一行的第三个移位寄存器的输出端与所述第一个多选一数据选择器的第P+2个输入端连接,所述移位寄存器阵列的第二行的第三个移位寄存器的输出端与所述第二个多选一数据选择器的第P+2个输入端连接;所述第一个多选一数据选择器和所述第二个多选一数据选择器的控制端均用于接入相同的控制信号,所述控制信号用于控制多选一数据选择器所选通的输入端,以使所述可配置数据流动卷积模块工作在深度卷积的数据流动卷积模式或逐点卷积的数据流动卷积模式;当所述控制信号为第一控制信号时,所述第一个多选一数据选择器和所述第二个多选一数据选择器的第1至第Y个输入端依次选通,所述可配置数据流动卷积模块进入深度卷积的数据流动卷积模式,其中,Y小于或等于P+1;当所述控制信号为第二控制信号时,所述第一个多选一数据选择器和所述第二个多选一数据选择器的第P+2个输入端选通,所述可配置数据流动卷积模块进入逐点卷积的数据流动卷积模式; 每个可配置加法树模块通过配置完成8输入、9输入、16输入、32输入的累加操作,每个可配置加法树模块包括:4个8输入加法树J1~J4、5个二输入加法器E1~E5和6个二选一数据选择器S1~S6; S1~S6的控制端均用于接入外部输入的选通控制信号,J1~J4的输入端均用于接入8组输入数据; J1的输出端与E1的一个输入端、S2的第一输入端和S1的第二输入端均连接,E1的另一个输入端用于接入1组数据,E1的输出端与S1的第一输入端连接,S1的输出端为所述可配置加法树模块的第一输出端O1; S2的输出端与E2的一个输入端连接,J2的输出端与E2的另一个输入端、S3的第二输入端均连接,S3的第一输入端与E2的一个输出端连接,S3的输出端为所述可配置加法树模块的第二输出端O2,E2的另一个输出端与E3的一个输入端连接,并且,E2的另一个输出端为所述可配置加法树模块的第三输出端O3; J3的输出端与E4的一个输入端、S4的第一输入端均连接,E4的另一个输入端与S5的输出端连接,E4的一个输出端与S4的第二输入端连接,E4的另一个输出端与E3的另一个输入端连接,E3的输出端为所述可配置加法树模块的第四输出端O4,并且,E4的另一个输出端为所述可配置加法树模块的第五输出端O5,S4的输出端为所述可配置加法树模块的第六输出端O6; J4的输出端与S5的第二输入端、E5的一个输入端和S6的第一输入端均连接,S5的第二输入端用于接入1组数据,E5的另一个输入端用于接入1组数据,E5的输出端与S6的第二输入端连接,S6的输出端为所述可配置加法树模块的第七输出端O7。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励