天津大学路文焕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利构音障碍语音的个性化合成与识别增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412540B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510359114.3,技术领域涉及:G10L13/08;该发明授权构音障碍语音的个性化合成与识别增强方法是由路文焕;张戴鹏;李威;张鸿程;王静红;魏建国设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。
本构音障碍语音的个性化合成与识别增强方法在说明书摘要公布了:本发明公开了一种构音障碍语音的个性化合成与识别增强方法,构音障碍语音合成模型包括:长程依赖特征编码模块、非稳态特征编码模块和解码模块,构音障碍语音合成模型的输入包括样本,输出包括合成构音障碍语音,样本为构音障碍文本序列;长程依赖特征编码模块的输入包括样本、输出为对齐向量z;非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。
本发明授权构音障碍语音的个性化合成与识别增强方法在权利要求书中公布了:1.一种构音障碍语音合成模型,其特征在于,包括:长程依赖特征编码模块、非稳态特征编码模块和解码模块,其中,长程依赖特征编码模块包括:音素编码模块、仿射变换模块、单调对齐模块和长程依赖持续时间预测模块;音素编码模块的输入为样本、输出为长程依赖特征向量,样本为构音障碍文本序列;仿射变换模块的输入为长程依赖特征向量、输出为长程依赖特征向量;长程依赖持续时间预测模块包括:流模块; 当构音障碍语音合成模型训练时,单调对齐模块的输入包括长程依赖特征向量和样本对应的说话人帧级表示,输出为对齐向量和音频持续时间特征向量;长程依赖持续时间预测模块的输入为长程依赖特征向量和音频持续时间特征向量,输出为随机噪声; 当构音障碍语音合成模型测试时,长程依赖持续时间预测模块的输入为随机噪声,输出为音频持续时间特征向量;单调对齐模块的输入包括音频持续时间特征向量和长程依赖特征向量、输出为对齐向量; 非稳态特征编码模块的输入包括对齐向量、输出为最终嵌入表示; 解码模块的输入为最终嵌入表示,输出为合成构音障碍语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300354 天津市津南区雅观路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励