上海三同自动化技术有限公司李佳栋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海三同自动化技术有限公司申请的专利一种工业现场高频声音识别方法和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120496577B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510991499.5,技术领域涉及:G10L25/51;该发明授权一种工业现场高频声音识别方法和存储介质是由李佳栋;张丞源设计研发完成,并于2025-07-18向国家知识产权局提交的专利申请。
本一种工业现场高频声音识别方法和存储介质在说明书摘要公布了:本申请涉及声音识别领域,尤其涉及一种工业现场高频声音识别方法和存储介质。方法包括:对工业现场声音信号使用双分支窗口进行短时傅里叶变换得到双分支谱图;对双分支谱图进行通道堆叠得到三维张量;对提取到的特征进行分类计算后,分类头输出包含目标音、环境音和强噪音这三个维度的概率评分的评分向量;对概率评分使用温度系数进行软化,并将软化后的概率评分输入分类函数以得到概率分布;计算能量分数,当能量分数低于预设的能量阈值时,计算衰减系数以对概率分布进行缩放抑制,得到最终概率分布,判定最终概率分布中最高值是否低于拒识阈值,得到识别结果。本申请的方法在工业实测中大幅提升了故障音的检出率,显著降低了误报率。
本发明授权一种工业现场高频声音识别方法和存储介质在权利要求书中公布了:1.一种工业现场高频声音识别方法,其特征在于,包括以下步骤: 工业现场声音采样; 对采集到的声音信号使用帧移相同、窗长不同的双分支窗口进行短时傅里叶变换,以得到双分支谱图,其中,所述双分支窗口包括高时间分辨率分支窗口和高频率分辨率分支窗口,所述双分支谱图包括通过所述高时间分辨率分支窗口得到的第一线性频谱图和通过所述高频率分辨率分支窗口得到的第二线性频谱图; 对所述双分支谱图进行通道堆叠,以得到包含时域特征和频域特征的三维张量; 对从所述三维张量提取到的特征进行分类计算后,分类头输出评分向量,所述评分向量包含目标音、环境音和强噪音这三个维度的概率评分; 对所述概率评分使用温度系数进行软化,并将软化后的概率评分输入分类函数以得到概率分布; 根据所有的软化后的概率评分计算能量分数,当所述能量分数低于预设的能量阈值时,根据其与所述能量阈值的差值计算衰减系数,并根据所述衰减系数对所述概率分布进行缩放抑制,以得到具有严格单调性的最终概率分布,判定所述最终概率分布中最高值是否低于拒识阈值,若是,则输出未知事件结果;若否,则输出对应类别的识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海三同自动化技术有限公司,其通讯地址为:201109 上海市闵行区瓶安路1258号1幢2001室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。