福州大学至诚学院黄巧云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉福州大学至诚学院申请的专利应用于语音识别的音频优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120299470B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510787147.8,技术领域涉及:G10L21/0216;该发明授权应用于语音识别的音频优化方法及系统是由黄巧云;薛博瑞设计研发完成,并于2025-06-13向国家知识产权局提交的专利申请。
本应用于语音识别的音频优化方法及系统在说明书摘要公布了:本申请涉及语音增强技术领域,具体涉及应用于语音识别的音频优化方法及系统,该方法包括:实时采集音频数据并均匀划分为各音频帧;针对各音频帧,预设音频帧的各近邻帧,评估采用谱减法对音频数据进行增强时,是否重新选取噪声谱;若重新选取,获取音频帧的各模态;从音频帧的模态中选取噪声模态并获取其余各模态的滞后帧数;获取各模态的频谱变化特征值和语音特征值,并选取主语音模态;获取除主语音模态外的其他各模态的音频模态特征值;进而获取噪声帧及新的噪声谱。本申请旨在通过提高噪声帧选取的准确性,增强谱减法针对音频帧语音特征的音频增强效果,进而提高语音识别的准确性。
本发明授权应用于语音识别的音频优化方法及系统在权利要求书中公布了:1.应用于语音识别的音频优化方法,其特征在于,该方法包括以下步骤: 实时采集音频数据并均匀划分为预设长度的各音频帧;采用谱减法对音频数据进行增强; 针对各音频帧,在音频帧之前预设音频帧的各近邻帧和各对比帧,通过所有近邻帧与所有对比帧的能量的变化程度,评估对音频数据进行增强时,是否重新选取噪声谱; 若重新选取,获取音频帧的各模态;通过所有近邻帧的各相同模态的能量的变化度,获取各模态的模态能量变化值,从音频帧的模态中选取音频帧的模态能量变化值最大的模态,记为噪声模态;将所有近邻帧的各相同模态的能量按照时序排列,组成各能量序列,通过分析音频帧的噪声模态与其余各模态之间能量序列的互相关性,获取其余各模态的滞后帧数; 通过音频帧与其各近邻帧之间各相同模态的边际谱的差异程度,获取各模态的频谱变化特征值;通过各模态的滞后帧数在近邻帧中的占比,结合所述频谱变化特征值,获取各模态的语音特征值,从音频帧的模态中选取音频帧的语音特征值最大的模态,记为主语音模态;通过主语音模态与其他各模态之间梅尔频率倒谱系数的相似度,获取其他各模态的音频模态特征值; 获取各音频帧的所有其他模态的音频模态特征值的离散度,通过各音频帧及其之后预设数量个近邻音频帧的所述离散度,获取噪声帧及新的噪声谱。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福州大学至诚学院,其通讯地址为:350001 福建省福州市鼓楼区杨桥西路50号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。