深圳市奥斯恩净化技术有限公司梁立飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市奥斯恩净化技术有限公司申请的专利一种基于特征的智能声纹识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119296568B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411489328.4,技术领域涉及:G10L25/03;该发明授权一种基于特征的智能声纹识别方法和系统是由梁立飞;冀慧丽设计研发完成,并于2024-10-24向国家知识产权局提交的专利申请。
本一种基于特征的智能声纹识别方法和系统在说明书摘要公布了:本发明属于声纹识别技术领域,本发明公开了一种基于特征的智能声纹识别方法和系统;包括:采集若干个声纹数据样本,并对每个声纹数据样本进行预处理,得到综合语音样本;基于综合语音样本构建语音有向图模型,从语音有向图模型识别出核心语音样本集合;将核心语音样本集合进行特征提取,得到个综合特征向量;基于综合特征向量和核心语音样本集合,利用聚类算法获取样本选择策略;基于综合特征向量,利用样本选择策略自适应训练声纹识别模型,在训练完成后,将训练好的声纹识别模型应用于声纹识别,充分发挥了深度学习在声纹识别领域的优势,不仅提高了声纹识别的速度和效率,还降低了系统的误识别率和漏识别率。
本发明授权一种基于特征的智能声纹识别方法和系统在权利要求书中公布了:1.一种基于特征的智能声纹识别方法,其特征在于,包括:S1、采集若干个声纹数据样本,并对每个声纹数据样本进行预处理,得到综合语音样本; S2、基于综合语音样本构建语音有向图模型,从语音有向图模型识别出核心语音样本集合; 所述构建语音有向图模型的方式包括: 将每个综合语音样本进行分帧,得到一系列语音帧;对每个语音帧提取特征向量,特征向量为梅尔频率倒谱系数或线性预测系数; 计算任意两个语音帧之间特征向量的相似度,作为语音帧之间的相似度,根据语音帧之间的相似度构建一个加权无向图,其中为语音帧的集合,为边的集合,将语音帧作为加权无向图的节点,若两个语音帧的相似度小于预设的相似度阈值,则在加权无向图中连接这两个节点,并定义边的权重为这两个语音帧的相似度; 相似度的计算公式为: ;其中,是两个语音帧和之间的距离度量;为语音帧的短时能量,为另一个语音帧的短时能量;和是两个调节参数;为两个语音帧和之间的相似度;为方向过零度量函数; 方向过零度量函数;式中,是两个语音帧和的特征向量的夹角,表示两个语音帧和的过零率之差的绝对值;为过零调节参数; 对加权无向图进行转置操作,得到其转置图,将中的每个边的方向反向,得到语音有向图模型; 进行转置操作的方式包括: 构建图神经网络模型,将图注意力网络作为图神经网络模型的骨架网络,定义图神经网络模型的输入是加权无向图的拓扑结构和节点;输出是节点的低维连续嵌入表示;对每个节点,提取其MFCC特征向量作为初始节点特征;将加权无向图及其初始节点特征输入到图神经网络模型中,定义图神经网络模型的训练目标为节点分类或链接预测; 通过反向传播算法训练图神经网络模型的参数,图神经网络模型学习得到每个节点的低维连续嵌入表示,基于得到的所有节点的低维连续嵌入表示,构建嵌入空间的邻接矩阵A_emb;邻接矩阵A_emb的元素为节点之间的低维连续嵌入表示的欧几里得距离;对邻接矩阵A_emb进行转置,得到转置邻接矩阵A_emb_T,根据转置邻接矩阵A_emb_T重建有向图,即得到转置图; S3、将核心语音样本集合进行特征提取,得到个综合特征向量; S4、基于综合特征向量和核心语音样本集合,利用聚类算法获取样本选择策略; S5、基于综合特征向量,利用样本选择策略自适应训练声纹识别模型,在训练完成后,将训练好的声纹识别模型应用于声纹识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市奥斯恩净化技术有限公司,其通讯地址为:518104 广东省深圳市宝安区新桥街道万丰社区大洋田工业区2栋401;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。