富联裕展科技(深圳)有限公司吴振廷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉富联裕展科技(深圳)有限公司申请的专利一种语音识别方法及语音识别装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116229947B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211624595.9,技术领域涉及:G10L15/06;该发明授权一种语音识别方法及语音识别装置是由吴振廷;闫莉;王青玉;张洪伟设计研发完成,并于2022-12-16向国家知识产权局提交的专利申请。
本一种语音识别方法及语音识别装置在说明书摘要公布了:本申请实施例提供了语音识别方法及语音识别装置,能够基于增添的语言模型可对于声学模型输出的识别结果进行调整,提高语音识别模型的识别准确性。其中,语音识别方法包括:获取历史音频数据和对应的历史音频文本数据;对历史音频文本数据进行预处理,并抽取历史音频文本数据中词汇数据;基于预先存储的中文词典与英文词典以及G2P模型,确定词汇数据的音素标注,并构建词汇词典;基于历史音频数据和历史音频文本数据的词汇数据,训练声学模型和语言模型,根据训练好的声学模型、训练好的语言模型及词汇词典,生成语音识别模型;获取待识别语音数据,将待识别语音数据输入语音识别模型,得到待识别语音数据的文本信息。
本发明授权一种语音识别方法及语音识别装置在权利要求书中公布了:1.一种语音识别方法,其特征在于,所述方法包括: 获取历史音频数据和对应的历史音频文本数据; 对所述历史音频文本数据进行预处理,并抽取所述历史音频文本数据中词汇数据; 基于预先存储的中文词典与英文词典以及G2P模型,确定所述词汇数据的音素标注,并构建词汇词典,其中,所述G2P模型是根据所述历史音频数据训练得到; 基于所述历史音频数据和所述历史音频文本数据的词汇数据,训练声学模型和语言模型,根据训练好的声学模型、训练好的语言模型及词汇词典,生成语音识别模型; 获取待识别语音数据,将所述待识别语音数据输入所述语音识别模型,得到待识别语音数据的文本信息; 所述G2P模型的训练方法包括: 获取所述历史音频数据,对所述历史音频数据进行预处理,所述历史音频数据包括中文音频数据、英文音频数据、中英文混合音频数据以及录制的特定专有词汇的音频数据; 提取预处理后的所述历史音频数据的特征向量; 将提取到的特征向量输入声学模型,得到所述历史音频数据对应的词汇表; 利用所述历史音频数据对应的词汇表训练G2P模型,得到训练好的G2P模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人富联裕展科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市龙华区龙华街道富康社区东环二路2号富士康H5厂房101、观澜街道福城大三社区富士康鸿观科技园B区厂房5栋C09栋4层、C07栋2层、C08栋3层4层、C04栋1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励