南方电网人工智能科技有限公司吴石松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南方电网人工智能科技有限公司申请的专利基于特征增强预训练模型的有效语音检测方法、装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119132337B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411031589.1,技术领域涉及:G10L25/51;该发明授权基于特征增强预训练模型的有效语音检测方法、装置是由吴石松;董召杰;李轩昂;梁寿愚;卢志良;陈柔伊;陈骞;赵必美;李紫京;苏立伟;刘振华;赵翔宇;郑桦;李成;冯勤宇设计研发完成,并于2024-07-30向国家知识产权局提交的专利申请。
本基于特征增强预训练模型的有效语音检测方法、装置在说明书摘要公布了:本申请涉及一种基于特征增强预训练模型的有效语音检测方法、装置。所述方法包括:获取包含有不同类型的噪声的待检测语音;将待检测语音输入至第一预训练模型,通过第一预训练模型提取得到待检测语音的有效语音特征;第一预训练模型所采用的第一训练数据为对无标注样本语音进行数据特征增强得到;将有效语音特征输入至第二预训练模型,通过第二预训练模型进行有效语音分类,得到分类结果序列;根据分类结果序列,输出待检测语音的有效语音片段;有效语音片段为去除待检测语音中噪声的语音片段。采用本方法能够适应更多的应用场景以及噪声类型,有效提升了有效语音检测效果,改善了有效语音检测的性能以提升语音识别系统的性能。
本发明授权基于特征增强预训练模型的有效语音检测方法、装置在权利要求书中公布了:1.一种基于特征增强预训练模型的有效语音检测方法,其特征在于,所述方法包括: 获取包含有不同类型的噪声的待检测语音; 将所述待检测语音输入至第一预训练模型,通过所述第一预训练模型提取得到所述待检测语音的有效语音特征;所述第一预训练模型所采用的第一训练数据为采用log梅尔声谱层面的数据增强方法,对无标注样本语音进行数据特征增强得到; 将所述有效语音特征输入至第二预训练模型,通过所述第二预训练模型进行有效语音分类,得到分类结果序列;所述第二预训练模型所采用的第二训练数据为对已标注样本语音进行数据特征增强得到;所述分类结果序列用于表征所述待检测语音中每个帧的语音是否为有效语音的概率; 根据所述分类结果序列,输出所述待检测语音的有效语音片段;所述有效语音片段为去除所述待检测语音中噪声的语音片段; 其中,所述方法还包括: 获取基于编码器和解码器结构的第一待训练模型;所述第一待训练模型包括用于对特征向量进行量化的量化模块; 结合所述第一训练数据和第一损失函数,对所述第一待训练模型进行自监督模型训练,得到用于提取有效语音特征的所述第一预训练模型;所述第一损失函数包括对比损失和多样性损失; 所述方法还包括: 获取基于语音识别任务的无标注样本语音; 根据所述无标注样本语音转换得到梅尔频谱矩阵,通过在所述梅尔频谱矩阵的时间维度进行平移和掩码处理,以及在所述梅尔频谱矩阵的频率维度进行掩码处理,得到所述无标注样本语音的增强后数据特征; 将所述无标注样本语音的增强后数据特征,作为所述第一训练数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南方电网人工智能科技有限公司,其通讯地址为:510700 广东省广州市黄埔区中新广州知识城亿创街1号406房之822;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励