厦门靠谱云股份有限公司郑义恒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门靠谱云股份有限公司申请的专利一种基于特定人物音色的语音实时合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115691465B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211292085.6,技术领域涉及:G10L13/02;该发明授权一种基于特定人物音色的语音实时合成方法是由郑义恒;肖永强设计研发完成,并于2022-10-20向国家知识产权局提交的专利申请。
本一种基于特定人物音色的语音实时合成方法在说明书摘要公布了:本发明涉及一种基于特定人物音色的语音实时合成方法。该方法以实时合成、音色拟人度高、训练样本要求低为独创点,优化模型的构建效率与使用性能。该方法实现阶段包括:数据预处理阶段、数据向量化阶段、模型构建阶段、模型训练阶段、模型推理阶段。本发明涉及的技术包括:人物音色辨别模型、深度门控循环神经网络、注意力机制。本发明中所提出的技术方案在有限的计算性能与开发周期内,使得声音模型同时具备拟人的语音流畅度与高度拟人的发音风格。
本发明授权一种基于特定人物音色的语音实时合成方法在权利要求书中公布了:1.一种基于特定人物音色的语音实时合成方法,其特征在于,包括: 数据预处理阶段,对原始音频数据进行规范化操作; 数据向量化阶段,将中文文本数据转化为拼音表示后,再转化为拼音所对应的向量编码序列,并使用带通滤波器组对文本对应的音频进行滑动窗口滤波,得到音频对应的频谱; 模型构建阶段,构建用于特定人物声音合成的神经网络模型,模型分为三个部分进行实现,分别是音色辨别模型、频谱合成模型、音频重建模型; 模型训练阶段,对音色辨别模型、频谱合成模型、音频重建模型分别进行拟合;音色辨别模型,采用说话人辨别的任务目标对音色辨别模型进行拟合;频谱合成模型,基于中文文本与音色辨别模型的输出的音色向量,对频谱合成模型进行拟合;音频重建模型,基于真实中文音频以及音频对应的带通滤波频谱对音频重建模型进行拟合; 模型推理阶段,将中文文本与特定人物的音色向量输入频谱合成模型,再将输出频谱输入到音频重建模型,最终合成出特定人物音色的语音片段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门靠谱云股份有限公司,其通讯地址为:361000 福建省厦门市湖里区火炬高新区软件园创新大厦C区3F-A317;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励