科大讯飞股份有限公司李鹏程获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利语音识别方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115512695B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211134105.7,技术领域涉及:G10L15/06;该发明授权语音识别方法、装置、设备及存储介质是由李鹏程;万根顺;潘嘉;熊世富;高建清;刘聪;刘庆峰设计研发完成,并于2022-09-15向国家知识产权局提交的专利申请。
本语音识别方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种语音识别方法、装置、设备及存储介质,本申请配置的语音识别模型通过第一语音分类层基于语音编码器输出的语音编码特征预测得到初始预测文本,文本编码器对初始预测文本进行编码,将文本编码特征和语音编码特征融合,将融合编码特征输入到共享编码器中进行二次编码,并由第二语音分类层基于二次编码特征得到最终预测文本。由于语音识别模型整体上能够提取到更加丰富的融合编码特征,因此能够进一步提升识别准确度。此外,由于语音识别模型包含有文本编码器和共享编码器,因而在训练过程可以额外使用纯文本数据对文本编码器和共享编码器进行训练,纯文本数据相比于语音的标注文本其更容易大量的获取,极大降低了人工标注成本。
本发明授权语音识别方法、装置、设备及存储介质在权利要求书中公布了:1.一种语音识别方法,其特征在于,包括: 获取待识别语音; 将所述待识别语音输入预配置的语音识别模型中,得到模型的第二语音分类层输出的最终预测文本,其中,所述语音识别模型被配置为:利用语音编码器对输入语音提取语音编码特征,利用第一语音分类层基于所述语音编码特征得到初始预测文本,利用文本编码器对所述初始预测文本进行文本编码,得到文本编码特征,由语音编码特征和文本编码特征组成融合编码特征,并利用共享编码器对所述融合编码特征进行二次编码,利用第二语音分类层基于二次编码特征得到最终预测文本; 对所述最终预测文本进行规整处理,得到所述待识别语音对应的识别文本; 其中,在语音识别模型输入训练文本时: 所述文本编码器用于对训练文本进行编码得到文本编码特征,由共享编码器对所述文本编码特征进行二次编码,得到训练文本的二次编码特征,经文本分类层基于所述训练文本的二次编码特征得到训练文本对应的最终预测文本; 所述语音识别模型的训练过程,包括: 获取训练语音文本对,及纯文本数据,所述训练语音文本对包括训练语音及对应的标注文本; 利用所述训练语音文本对及所述纯文本数据训练语音识别模型,直至达到设定收敛条件,得到训练后的语音识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励