Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京理工大学赵兆获国家专利权

南京理工大学赵兆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京理工大学申请的专利一种基于双通道语音增强的鸟鸣物种识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115116461B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210861205.3,技术领域涉及:G10L21/02;该发明授权一种基于双通道语音增强的鸟鸣物种识别方法是由赵兆;杨露;许志勇设计研发完成,并于2022-07-22向国家知识产权局提交的专利申请。

一种基于双通道语音增强的鸟鸣物种识别方法在说明书摘要公布了:本发明公开了一种基于双通道语音增强的鸟鸣物种识别方法。该方法将采集到的双通道的鸟鸣信号,先经过增加了泄露抑制和信号恢复模块的改进广义旁瓣对消器进行初步降噪,再经过双通道的后滤波进行进一步降噪,得到更纯净的期望鸟鸣信号;将增强后的鸟鸣信号分成训练集和测试集,训练鸟鸣经过预处理、特征提取、码本构造、编码、降维后,建立起训练鸟鸣的特征数据库;对于待识别的鸟鸣,经过预处理、特征提取、编码、降维转换、分类后即可得到识别出的鸟类物种。本发明实用性强、经济便捷,能充分利用采集到的双通道鸟鸣信号信息,通过波束形成算法对信号进行增强处理能够提高鸟鸣信号的信噪比,从而提高鸟鸣物种识别的准确率。

本发明授权一种基于双通道语音增强的鸟鸣物种识别方法在权利要求书中公布了:1.一种基于双通道语音增强的鸟鸣物种识别方法,其特征在于,所述方法包括以下步骤: 步骤1,对采集到的双通道鸟鸣信号进行统一采样; 步骤2,对步骤1获得的鸟鸣信号进行滤波和增强处理,形成样本集; 步骤3,将样本集划分为训练集和测试集; 步骤4,对训练集的鸟鸣信号进行预处理、特征提取、码本构造、编码和降维,获得训练鸟鸣的特征数据集; 步骤5,结合步骤4得到的训练鸟鸣的特征数据集,对待识别鸟鸣信号进行预处理、特征提取、VLAD编码、降维,再经分类器分类后得到待识别鸟鸣的物种; 步骤4具体包括以下步骤: 步骤4-1,对训练集的鸟鸣信号进行预处理,具体为: 步骤4-1-1,首先将输入信号按照2s一个窗长进行划分,且相邻窗之间重叠1.75s,得到若干个窗口并命名为纹理窗口; 步骤4-1-2,计算每个纹理窗口的能量P并将单位转换为dB,同时设置门限PTH以滤除纹理窗口中不含鸟鸣的无声窗口,PTH的公式为: PTH=Pmax-20 其中,Pmax为输入鸟鸣信号中功率最大的纹理窗口的能量; 计算每个纹理窗口的权重为w: w=max{P-PTH,0} 步骤4-1-3,对于权重w0的纹理窗口,按照每帧512个采样点,并且相邻帧之间重叠256个样本点,求出能量最大的帧fmax,取fmax前后各127帧,若不足127帧,则做补零处理,得到长度为NR=65536的片段,记为识别窗口; 步骤4-1-4,对识别窗口x[n]做归一化处理,公式为: 其中,μ为每个识别窗口的均值,σ为标准差; 步骤4-2,对预处理得到的信号,进行离散小波特征提取,具体包括以下步骤: 步骤4-2-1,对信号进行离散小波分解,得到一个低频子带A1和一个高频子带D1,对低频子带进一步分解,得到低频子带A2和高频子带D2,以此经过L次分解后,得到L个高频子带Dl和一个低频子带AL,l=1,2,…L; 步骤4-2-2,去除超过奈奎斯特采样率的高频子带D1,对L-1个高频子带Dl提取同一时刻的系数,组成一个瞬时声学单元,再将每个瞬时声学单元的系数进行最大池化,得到紧凑的表示CUt,再经过减均值运算后,得到特征描述符ft;假设DL的长度为NL,则t=1,2,…,NL,ft的公式为: ft=[ft[1],ft[2],...,ft[L-1]]T 式中,ft[1],ft[2],...,ft[L-1]分别表示从L-1个高频子带中提取出的特征; 步骤4-3,对步骤4-2得到的特征描述符进行k均值聚类,得到大小为K的码本C,码本公式为: C={c1,c2,...,cK} 式中,ck为第k个码字,k=1,2,...,K; 步骤4-4,将所有特征描述符ft,分配给距离最近的τ个码字ck,对于每个码字ck,得到一个残余向量rk: 再将k个残余向量拼接成一个KL-1维的表达长期特征的特征向量v: 步骤4-5,对步骤4-4得到的特征向量进行降维处理,从而建立训练鸟鸣的特征数据集,其步骤如下: 步骤4-5-1,求取所有训练鸟鸣特征的协方差矩阵∑,然后计算协方差矩阵的特征值,并进行降序排列;取占所有特征值总和αPCA的前d维特征,d的取值通过下式确定: 前d维特征值对应的特征向量即为PCA转换矩阵APCA: APCA=[a1,a2,...ad] 式中,aj为第j个特征值λj对应的特征向量; 则对步骤4-4得到的特征向量进行PCA降维后的特征向量为: 步骤4-5-2,通过LDA对经PCA降维后的向量进行进一步降维,得到维度为S-1维的特征向量y: 其中S为鸟鸣物种的数量,LDA转换公式为: 式中,SB为类间散射矩阵,SW为类内散射矩阵; 步骤5所述结合步骤4得到的训练鸟鸣的特征数据集,对待识别鸟鸣信号进行预处理、特征提取、VLAD编码、降维,再经分类器分类后得到待识别鸟鸣的物种,包括以下步骤: 步骤5-1,对待识别鸟鸣信号进行预处理,操作流程同步骤4-1; 步骤5-2,对步骤5-1处理后的信号进行离散小波特征提取,操作流程同步骤4-2; 步骤5-3,对特征提取后的特征描述符进行编码,参考码本为步骤4-2训练鸟鸣构造的码本,操作流程同步骤4-4; 步骤5-4,对编码后的高维向量进行降维处理,先进行PCA转换,再进行LDA转换,得到S-1维的低维特征; 步骤5-5,对于一段待识别片段,首先经过预处理分成W个识别窗口,再经上述特征提取、编码、降维后,得到W个低维特征yi,具体表示为: yi=[yi[1],yi[2],...,yi[S-1]]T 再计算yi到训练鸟鸣特征数据集中每种鸟鸣的最短距离,得到dis,i=1,2,…W; 最后计算W个识别窗口的最短加权距离,距离最短的一类即为识别出的鸟种sid: 其中,wi为第W个识别窗口对应的权值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。