中国社会科学院语言研究所方强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国社会科学院语言研究所申请的专利一种融合多任务学习的变分自编码器的发音逆推方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121122286B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511417734.4,技术领域涉及:G10L17/04;该发明授权一种融合多任务学习的变分自编码器的发音逆推方法和装置是由方强设计研发完成,并于2025-09-30向国家知识产权局提交的专利申请。
本一种融合多任务学习的变分自编码器的发音逆推方法和装置在说明书摘要公布了:本发明涉及语音识别技术领域,公开了一种融合多任务学习的变分自编码器的发音逆推方法和装置,包括:采集同步的语音信号和发音运动数据;基于语音信号训练声学域变分自编码器,声学域变分自编码器将第一说话人特征输入说话人识别器以识别说话人;最终将第一内容特征和第一说话人特征输入第一解码器重构的声学特征;基于发音运动数据训练发音域变分自编码器,发音域变分自编码器将第二内容特征输入第二语音识别器以识别语音内容;最终将第二内容特征和第二说话人特征输入第二解码器重构的发音特征;构建发音逆推系统,合成发音运动轨迹。
本发明授权一种融合多任务学习的变分自编码器的发音逆推方法和装置在权利要求书中公布了:1.一种融合多任务学习的变分自编码器的发音逆推方法,其特征在于,包括: 步骤S1:采集同步的语音信号和发音运动数据; 步骤S2:基于所述语音信号训练声学域变分自编码器,其中,所述声学域变分自编码器包括第一内容编码器、说话人编码器、第一语音识别器、说话人识别器和第一解码器,所述第一内容编码器和说话人编码器分别用于从所述语音信号中提取第一内容特征和第一说话人特征,将所述第一内容特征输入第一语音识别器以识别语音内容,以及将所述第一说话人特征输入说话人识别器以识别说话人;最终将所述第一内容特征和第一说话人特征输入第一解码器以重构声学特征; 步骤S3:基于所述发音运动数据训练发音域变分自编码器,其中,所述发音域变分自编码器包括所述说话人编码器、第二内容编码器、第二语音识别器和第二解码器,所述说话人编码器用于从所述语音信号中提取第二说话人特征,所述第二内容编码器用于从所述发音运动数据中提取第二内容特征,以及将所述第二内容特征输入第二语音识别器以识别语音内容;最终将所述第二内容特征和第二说话人特征输入第二解码器以重构发音特征; 步骤S4:构建内容逆推网络,并基于所述第一内容编码器、第一说话人编码器、内容逆推网络和第二解码器构建发音逆推系统,合成发音运动轨迹。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国社会科学院语言研究所,其通讯地址为:100732 北京市东城区建国门内大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励