桂林电子科技大学安正义获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林电子科技大学申请的专利基于自适应宽度自注意力机制的轻量化异常声事件检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114386518B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210039999.5,技术领域涉及:G06F18/214;该发明授权基于自适应宽度自注意力机制的轻量化异常声事件检测方法是由安正义;姚雨;宋浠瑜;王玫;仇洪冰设计研发完成,并于2022-01-14向国家知识产权局提交的专利申请。
本基于自适应宽度自注意力机制的轻量化异常声事件检测方法在说明书摘要公布了:本发明公开了基于自适应宽度自注意力机制的轻量化异常声事件检测方法,该方法首先把带标签的音频进行信号处理得到它的某种时频特征表示;其次,把带标签的特征表示通常是向量或矩阵当作输入,给自适应宽度自注意力机制模型,然后,自适应宽度自注意力机制模型中有定义好的损失函数和随机初始化注意力权重,根据自适应自注意力机制算法算出和标签的损失值,接下来用反向传播算法,更新自适应注意力权重,通过对注意力三个输入权重持续进行更新迭代,直到损失函数达到最小或理想状态。最后,使用轻量化的方法保存此时的权重参数,接下来以此权重参数为模型对一段未标注的音频做预测,快速准确的对发生的异常声事件。
本发明授权基于自适应宽度自注意力机制的轻量化异常声事件检测方法在权利要求书中公布了:1.基于自适应宽度自注意力机制的轻量化异常声事件检测方法,其特征是:包括如下步骤: 1构建合成音频数据集,并对每个包含多个异常声事件的音频进行标签和分类; 2对数据集进行预处理和特征提取,送入搭建好的自适应宽度自注意力机制模型中进行网络迭代训练,直到模型达到最优; 3使用轻量化的方法对模型进行压缩,得到自适应宽度自注意力机制的轻量化检测模型;所述自适应宽度自注意力机制的轻量化检测模型的搭建方法,包括: 1预训练模型: 采用Python框架搭建如下的自注意力机制模型网络:模型经过了3次卷积、三次池化、一次门控循环单元GRU、一层自适应宽度自注意力机制、一层时间分布;其中:第一层为输入层、输入40维对数梅尔倒谱系数;第二层为输入通道为64*5*5的卷积层接的最大池化;第三层为输入通道为64*5*5的卷积层接4*1的最大池化;第四层为输入通道为64*5*5的卷积层接2*1的最大池化;第五层为是由reshape和Permute组成对第四层的输出进行降维和转置;第六层为使用神经元个数为64、使用tanh激活的GRU;第七层为一个自适应宽度自注意力机制、采用add-attention类型、使用sigmoid激活;第八层为使用sigmoid激活、Dense为声事件类别数的时间分布;每个卷积层都使用大小为的卷积核、步长为1,并且每个卷积层接一个标准化层、且都是用‘Relu’函数激活,同时加入了dorpout; 然后,将第六层输出作为输入输入到注意力层,把输入与注意力层的三个注意力权重矩阵相乘,分别得到查询Q,键K,值V三个注意力矩阵,经过运算得到注意力权重,通过不断训练迭代注意力权重,使损失函数达到最小,得到最优模型;同时采用了自适应宽度的自注意力机制模型,可以通过每次训练迭代控制宽度,以达到最优化;其中: 2自注意力机制模型: 从音频文件中读取并处理的特征序列,然后分别乘上相应的注意力矩阵得到注意力输入矩阵; ; 其中,是注意力机制输出的维度;然后进行如下运算: ; ; 其中是一个被预先设定好的值,表示时间位置;最终输出为: ; 3自适应宽度自注意力机制模型: 将注意力宽度也作为训练的参数,放入模型中一起训练学习,自适应的选择注意力的宽度;实现时则是是引入了一个mask函数: ; 该函数是一个将距离映射到[0,1]的非递增函数,由b参数化,其中是设定的注意力的最大宽度,是表示注意力宽度的下降的斜率;此时的注意力分数为: ; 自适应宽度自注意力机制通过在一定程度上牺牲一些序列信息,节省运算时间,过滤干扰信息,提高运算效率,改善城市道路异常声事件检测方法的有效性与可靠性; 轻量化:将训练好的自适应宽度自注意力机制检测模型在存储和预测时使用16位低精度的浮点数代替32位高精度的浮点数,轻量化的一般形式表示为: ; 其中和分别为量化前和量化后的数,是量化因数,是原值域中0在量化之后的值,因为在经过padding和ReLu时,权重和输入中会有很多的0,所以在量化时需要让实数0被准确的表示; 其中量化因数的选取决定了量化后的模型和原模型的误差,所以量化因数的选取就非常重要,为使量化后在16位数表示范围内,这里的量化因数的选取如下公式: ; 其中和分别是量化前对象的最大值和最小值; 4自适应宽度自注意力机制的轻量化模型: 将训练数据集的对数梅尔倒谱系数送入自适应宽度自注意力机制模型搭建的自适应宽度自注意力机制轻量化模型,模型中各层权重初始值参数由PyTorch随机给定,得到输出,其中C为事件类别总数,T为总帧数,计算真阳性预测标签损失,将和逐元素相乘得到输出,最后计算如下二项交叉熵损失函数: ; 梯度反向传播,使用Adam梯度下降法,学习率设置为0.001,更新权值参数,迭代训练直到损失达到最小,保存模型参数得到自适应宽度自注意力机制检测模型; 4将待检测音频进行预处理、特征提取,送入压缩好的检测模型中进行检测,得到预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林电子科技大学,其通讯地址为:541004 广西壮族自治区桂林市七星区金鸡路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励