新疆大学黄浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉新疆大学申请的专利一种基于持久性口音记忆的口音识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116486790B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310326132.2,技术领域涉及:G10L15/06;该发明授权一种基于持久性口音记忆的口音识别方法是由黄浩;李睿;殷丽丽;王凯;胡英设计研发完成,并于2023-03-30向国家知识产权局提交的专利申请。
本一种基于持久性口音记忆的口音识别方法在说明书摘要公布了:本申请涉及语音识别领域,尤其涉及一种基于持久性口音记忆的口音识别方法。包括:构建包括自监督预训练模型WavLM的WavLM‑编码器‑解码器基础结构;获取英语口语训练集,输入所述英语口音训练集至WavLM‑编码器‑解码器基础结构,得到编码器输出和持久性口音记忆PAM;针对WavLM‑编码器‑解码器基础结构进行优化处理,得到WavLM‑编码器‑解码器优化结构;通过英语口语训练集进行训练,得到口音识别模型;输入待识别的音频至所述口音识别模型,获取口音识别结果。本申请可以通过自监督预训练模型WavLM提取英语口语训练集的表征SSLRs并且通过SSLRs代替传统的声学特征Fbank,系统性能获得显著的提升,所以可解决口音数据稀缺,在低资源场景下口音识别效果差的问题。
本发明授权一种基于持久性口音记忆的口音识别方法在权利要求书中公布了:1.一种基于持久性口音记忆的口音识别方法,其特征在于,包括: S1:构建包括自监督预训练模型WavLM的WavLM‑编码器‑解码器基础结构,所述解码器包括用于口音识别的AR模块; S2:获取包括若干段涵盖不同口音的音频的英语口语训练集,以及输入所述英语口语训练集至WavLM‑编码器‑解码器基础结构,相应地得到编码器输出,以及针对编码器输出依次进行调整处理和聚类处理,得到持久性口音记忆PAM; S3:针对WavLM‑编码器‑解码器基础结构进行优化处理,优化处理包括:将AR模块调整为可接收PAM并且还可针对编码器输出和PAM进行融合处理,相应地得到WavLM‑编码器‑解码器优化结构; S4:通过英语口语训练集对WavLM‑编码器‑解码器优化结构进行训练,相应地得到以待识别的音频为输入项并且以口音识别结果为输出项的口音识别模型; S5:获取待识别的音频并且输入待识别的音频至所述口音识别模型,获取相应于待识别的音频的口音识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人新疆大学,其通讯地址为:830000 新疆维吾尔自治区乌鲁木齐市胜利路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励