安庆师范大学季艳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安庆师范大学申请的专利多源语料融合的低资源语言语音识别系统及其训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119132279B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411267948.3,技术领域涉及:G10L15/00;该发明授权多源语料融合的低资源语言语音识别系统及其训练方法是由季艳;冯慧敏设计研发完成,并于2024-09-11向国家知识产权局提交的专利申请。
本多源语料融合的低资源语言语音识别系统及其训练方法在说明书摘要公布了:本发明涉及低资源语言语音识别系统技术领域,具体涉及多源语料融合的低资源语言语音识别系统及其训练方法,包括多源语言框架,使用已标注的高资源语种和低资源语种的语音数据训练出识别该低资源语种语音的模型,多源语言框架包括三个部分:声学层、语言层和发音层,通过创新的多源语言框架和先进的特征融合技术,成功地克服了上述技术难题。它不仅能够有效地利用高资源语言的知识来增强低资源语言的识别效果,还能精确地捕捉不同语言间的共性和差异。此外,本发明在处理多语言混合环境时表现出色,大大提高了系统的适应性和泛化能力。
本发明授权多源语料融合的低资源语言语音识别系统及其训练方法在权利要求书中公布了:1.利用多源语料融合的低资源语言语音识别系统,其特征在于:包括多源语言框架,使用已标注的高资源语种和低资源语种的语音数据训练出识别该低资源语种语音的模型,所述多源语言框架包括三个部分:声学层、语言层和发音层,其中, 所述声学层通过ASVD的方式将每个声学特征映射到一个表示每个语言无关的特征的公共声道编码子空间和一个表示语言特异性信息的声道残差空间,前者用于预测每个帧的音素概率分布,后者则用于预测每种语言的每个帧的音素概率分布,解码模块则通过语音网络,语言网络和发音网络在每个维度上传播概率分布,输出最终的预测结果; 声学模型通过ASVD将训练数据分成了由公共声道编码器和声道残差编码器共同组成的两个部分,前者使用一个ASVD成分进行声学训练,后者使用剩余的ASVD成分训练,从而获得可以提取多种声学信息的能力; 语言模型,用于对语言的不确定性进行建模,提高语言感知任务效果; 发音模型,将每个音素与不同的语言标记进行对齐,在增加模型语言感知能力的同时,避免音素和语言的混淆; 特征融合方案,包括多尺度对比学习、层次化注意力对齐、对抗式特征解耦与重组以及图神经网络增强的跨语言知识传播的特征融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安庆师范大学,其通讯地址为:246002 安徽省安庆市菱湖南路128号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。