广东电力信息科技有限公司吴广财获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东电力信息科技有限公司申请的专利一种基于声学模型和语言模型的音频识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114171000B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111446042.4,技术领域涉及:G10L15/00;该发明授权一种基于声学模型和语言模型的音频识别方法是由吴广财;赖蔚蔚;郑颖龙;叶杭;周昉昉;陈颖璇;郑杰生;李雪武;林嘉鑫;黄宏恩设计研发完成,并于2021-11-30向国家知识产权局提交的专利申请。
本一种基于声学模型和语言模型的音频识别方法在说明书摘要公布了:本申请提供了一种基于声学模型和语言模型的音频识别方法。本方法包括:获取音频片段;基于声学模型对音频片段进行处理,得到音频片段对应的音素序列,音素序列包括用于表征标点符号的标点音素;基于语言模型对音素序列进行处理,得到音素序列对应的文本信息,文本信息包括标点符号。本方法无需引入其他的标点模块和搜索模块对纯文本信息进行处理,通过声学模型和语言模型可以直接得到音频片段对应的带有标点符号的文本信息,使得音频识别更加方便和高效。
本发明授权一种基于声学模型和语言模型的音频识别方法在权利要求书中公布了:1.一种基于声学模型和语言模型的音频识别方法,其特征在于,所述方法包括: 获取音频片段; 基于声学模型对所述音频片段进行处理,得到所述音频片段对应的音素序列,所述音素序列包括用于表征标点符号的标点音素,所述标点音素包括安静音和不明音,所述安静音由所述声学模型对无法提取语音特征的,且平均响度值小于或等于预设响度值音频子片段进行处理得到,所述不明音由所述声学模型对无法提取语音特征的,且平均响度值大于所述预设响度值的音频子片段进行处理得到;所述声学模型是通过第一训练音频片段对初始声学模型训练得到的,所述第一训练音频片段标注有第一训练音素序列,所述第一训练音素序列包括第一训练标点音素; 基于语言模型对所述音素序列进行处理,得到所述音素序列对应的文本信息,所述文本信息包括标点符号,所述语言模型是通过第二训练音素序列对初始语言模型训练得到的,所述第二训练音素序列标注有第一训练文本信息,所述第二训练音素序列包括第二训练标点音素,所述第一训练文本信息包括训练标点符号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东电力信息科技有限公司,其通讯地址为:510000 广东省广州市越秀区东风东路808号509房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励