中国传媒大学孟明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国传媒大学申请的专利基于动态神经网络和特征调制的零样本语音克隆方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119360821B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411631072.6,技术领域涉及:G10L13/02;该发明授权基于动态神经网络和特征调制的零样本语音克隆方法是由孟明;杨紫伊;苏镇杰;侯小萍;郝君怡;范肇心;朱永贵设计研发完成,并于2024-11-15向国家知识产权局提交的专利申请。
本基于动态神经网络和特征调制的零样本语音克隆方法在说明书摘要公布了:本发明公开了基于动态神经网络和特征调制的零样本语音克隆方法,所述方法包括说话人风格编码器从参考音频中提取说话人风格向量;基于SGF算法对说话人风格向量进行特征调制,将调制后的说话人风格向量输入生成器;所述生成器基于动态神经网络合成目标说话人音频。所述方法能够在零样本情境下对任一说话人的音频进行克隆,合成流畅自然、相似度高的目标音频。
本发明授权基于动态神经网络和特征调制的零样本语音克隆方法在权利要求书中公布了:1.一种基于动态神经网络和特征调制的零样本语音克隆方法,其特征在于,所述方法包括如下步骤: 说话人风格编码器从参考音频中提取说话人风格向量; 基于SGF算法对说话人风格向量进行特征调制,包括: 设表示音素序列特征向量,其中表示音素序列特征向量的维度,对音素序列特征向量进行标准化: , , , 式中,表示标准化后的特征向量,表示特征向量的均值,表示特征向量的方差,表示特征向量索引,是特征向量的维度; 通过四个参数对最终的风格向量进行调制: , , 式中,w表示风格向量,表示通过双曲正切函数处理最终的风格向量得到的第一缩放因子;表示通过双曲正切函数处理最终的风格向量得到的偏置因子;表示通过双曲正切函数处理最终的风格向量得到的基准特征,用于平衡和;表示通过Sigmoid函数处理最终的风格向量得到的动态调节因子; 通过加权操作将四个参数应用于标准化的特征向量: , , , 式中,表示融合风格向量后的特征序列; 将调制后的说话人风格向量输入生成器;所述生成器基于动态神经网络合成目标说话人音频,其中动态神经网络根据音素序列长度选择预测器架构:长音素序列采用带线性层的预测器;短音素序列采用带一维卷积层的预测器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国传媒大学,其通讯地址为:100024 北京市朝阳区定福庄东街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励