恭喜北京航空航天大学陆峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京航空航天大学申请的专利一种特定场景下的中英文混合的离线语音关键词识别方法及其系统实现获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114530141B 。
龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011323748.7,技术领域涉及:G10L15/00;该发明授权一种特定场景下的中英文混合的离线语音关键词识别方法及其系统实现是由陆峰;薛玉敏设计研发完成,并于2020-11-23向国家知识产权局提交的专利申请。
本一种特定场景下的中英文混合的离线语音关键词识别方法及其系统实现在说明书摘要公布了:本公开的实施例公开了一种中英文混合的离线语音关键词识别方法及其系统。该方法的一具体实施方式包括:获取语音数字信号,对其进行语音活动检测,得到待识别语音段;定义自适应关键词匹配窗口,分割待识别语音段;对语音段进行特征提取,得到梅尔频率倒谱系数嵌入特征向量;分析自定义关键词列表,结合预先训练的音素补白模型,得到中文解码网络空间和英文解码网络空间;将所述梅尔频率倒谱系数嵌入特征向量依次输入所述解码网络空间中,得到识别结果;对识别结果后处理,生成目标识别结果。该实施方式的计算量低,可以离线识别,识别准确率高,响应速度快,支持中英文混合识别,能够灵活的更换关键词列表从而适应不同场景下的应用。
本发明授权一种特定场景下的中英文混合的离线语音关键词识别方法及其系统实现在权利要求书中公布了:1.一种中英文混合的离线语音关键词识别方法,包括: 获取语音数字信号,对其进行语音活动检测,得到待识别语音段; 定义自适应关键词匹配窗口,分割待识别语音段; 对所述窗口内的语音段进行特征提取,得到梅尔频率倒谱系数嵌入特征向量; 分析特定场景下的自定义关键词列表,以及结合预先训练的音素补白模型,得到自定义关键词的中文解码网络空间和英文解码网络空间; 将所述梅尔频率倒谱系数嵌入特征向量依次输入所述解码网络空间中,得到识别结果; 对所述识别结果后处理,生成目标识别结果作为输出; 其中,所述分析特定场景下的自定义关键词列表,以及结合预先训练的音素补白模型,得到自定义关键词的中文解码网络空间和英文解码网络空间,包括: 以上下文相关音素为基本建模单元训练隐马尔可夫模型声学模型,以在线式废料模型构建音素补白模型,其中,音素作为构成语音的最小基本单位,所述在线式废料模型直接在所述音素补白模型中计算每一个语音帧的局部废料概率评分,不需要单独训练废料模型; 根据不同场景的应用需求,自定义关键词列表,以卡麦基梅隆大学字典的划分方式,生成关键词和音素对应关系的字典信息; 以关键词文本作为语言模型语料库,基于统计语言模型进行语言建模,对于给定关键词序列,3元语言模型概率表示如下: , 其中,表示关键词序列,表示关键词序列中的第个字,表示关键词序列中的第个字,表示关键词序列中的第个字,表示关键词序列的长度,表示序号,表示概率,表示以顺序出现的关键词序列的概率,表示在已知和的情况下的概率,表示关键词序列中的第个字,表示关键词序列中的第个字,表示第个到第个概率进行连乘计算; 所述预先训练的音素补白模型、字典信息和3元语言模型概率,三者共同构成自定义关键词列表的中文解码网络空间和英文解码网络空间,其中,当关键词列表更改时,组成语音的音素不需要重新训练,只需要重新生成待识别关键词列表的字典信息和3元语言模型概率即可。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。