京东科技信息技术有限公司邓丽萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉京东科技信息技术有限公司申请的专利语音识别纠错方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116434752B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310526330.3,技术领域涉及:G10L15/26;该发明授权语音识别纠错方法和装置是由邓丽萍;范璐;何晓冬设计研发完成,并于2023-05-11向国家知识产权局提交的专利申请。
本语音识别纠错方法和装置在说明书摘要公布了:本发明公开了一种语音识别纠错方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:获取音频数据和语音识别文本;将音频数据输入音频特征抽取模型,得到音频特征向量;将语音识别文本输入文本特征抽取模型,得到文本特征向量;将音频特征向量和文本特征向量输入关联注意力模块;在关联注意力模块,基于音频特征向量和文本特征向量执行关联注意力计算,输出融合音频特征向量和文本特征向量的双模态表征向量;将双模态表征向量输入纠错解码器,得到语音识别文本的纠错结果。该实施方式通过在纠错模型中引入融合语音和文本的双模态特征来提高纠错准确率。
本发明授权语音识别纠错方法和装置在权利要求书中公布了:1.一种语音识别纠错方法,其特征在于,包括: 获取音频数据和待处理的、所述音频数据的语音识别文本; 将所述音频数据输入预先训练的音频特征抽取模型,得到所述音频数据的音频特征向量;将所述语音识别文本输入预先训练的文本特征抽取模型,得到所述语音识别文本的文本特征向量; 将所述音频特征向量和所述文本特征向量输入预先训练的关联注意力模块;在所述关联注意力模块,基于所述音频特征向量和所述文本特征向量执行关联注意力计算,输出融合所述音频特征向量和所述文本特征向量的双模态表征向量; 将所述双模态表征向量输入预先训练的纠错解码器,得到所述语音识别文本的纠错结果; 所述纠错解码器包括依次连接并且结构相同的多个解码层,每一解码层包括依次连接的自注意力子层、关联注意力子层和前馈网络子层;以及,所述将所述双模态表征向量输入预先训练的纠错解码器,包括:将所述双模态表征向量输入每一解码层的关联注意力子层; 所述关联注意力模块和所述纠错解码器通过以下步骤进行联合训练:获取包括训练音频数据以及相应的训练语音识别文本和作为标签的训练纠错文本;将所述训练音频数据输入所述音频特征抽取模型,得到所述训练音频数据的训练音频特征向量;将所述训练语音识别文本输入所述文本特征抽取模型,得到所述训练语音识别文本的训练文本特征向量;将所述训练音频特征向量和所述训练文本特征向量输入所述关联注意力模块;在所述关联注意力模块,基于所述训练音频特征向量和所述训练文本特征向量执行关联注意力计算,输出融合所述训练音频特征向量和所述训练文本特征向量的训练表征向量;将所述训练表征向量输入所述纠错解码器中各解码层的关联注意力子层,将当前时间步的已生成语素的嵌入向量输入所述纠错解码器的最前端解码层,获得所述纠错解码器的训练输出结果;比对所述训练输出结果与所述训练纠错文本形成用于训练所述关联注意力模块和所述纠错解码器的损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人京东科技信息技术有限公司,其通讯地址为:100176 北京市大兴区北京经济技术开发区科创十一街18号院2号楼6层601;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励