Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京思麦力传媒科技有限公司赵吴华获国家专利权

北京思麦力传媒科技有限公司赵吴华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京思麦力传媒科技有限公司申请的专利基于TTS语音技术的声音克隆方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121053960B

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511432805.8,技术领域涉及:G10L13/02;该发明授权基于TTS语音技术的声音克隆方法、装置及存储介质是由赵吴华;王蕤;马逸瑶设计研发完成,并于2025-10-09向国家知识产权局提交的专利申请。

基于TTS语音技术的声音克隆方法、装置及存储介质在说明书摘要公布了:本发明涉及语音合成技术领域,尤其涉及一种基于TTS语音技术的声音克隆方法、装置及存储介质,所述方法包括:采集目标音频数据,并对目标音频数据进行预处理;提取预处理后的目标音频数据的目标声学特征,并根据提取的目标声学特征构建目标声学参数数据库;获取目标文本及其情感标签,并生成音素序列和目标参数序列;遍历音素序列,以定位元音节点,并根据定位结果优化目标参数序列;基于目标参数序列生成合成音频,并对合成音频进行声纹一致性检验。本发明显著降低了对原始录音数据的依赖和制作成本,极大地提升了声音生成效率。

本发明授权基于TTS语音技术的声音克隆方法、装置及存储介质在权利要求书中公布了:1.一种基于TTS语音技术的声音克隆方法,其特征在于,包括: 采集目标音频数据,并对目标音频数据进行预处理; 提取预处理后的目标音频数据的目标声学特征,并根据提取的目标声学特征构建目标声学参数数据库; 获取目标文本及其情感标签,并生成音素序列和目标参数序列; 遍历音素序列,以定位元音节点,并根据定位结果优化目标参数序列; 基于目标参数序列生成合成音频,并对合成音频进行声纹一致性检验; 根据各音素单元在特定文本中所述的情感标签对音频段打上情感标记,所述特定文本为包含所有音素、覆盖高中低不同音调,并包含平静、喜悦、悲伤、愤怒四种基本情感语句; 计算目标音频数据中同一情感标记下同一音素单元的音频段的声学特征的平均值,并将第i音素单元的音频段的基频值的平均值记作F0i,将第i音素单元的音频段的共振峰参数的平均值记作{F1i,F2i,F3i},F1i为第i音素单元的音频段的第一共振峰值,F2i为第i音素单元的音频段的第二共振峰值,F3i为第i音素单元的音频段的第三共振峰值,将第i音素单元的音频段的能量值的平均值记作Ei,将第i音素单元的音频段的时长的平均值记作Di,{F0i,F1i,F2i,F3i,Ei,Di}为该情感标记下音素i的声学特征; 以{音素i,情感标记}为键,以{F0i,F1i,F2i,F3i,Ei,Di}为值,构建目标声学参数数据库; 遍历音素序列,识别出其中所有的元音节点,对于每一个元音节点vj,若与其相邻的音素均为元音节点,则将其作为目标节点,并获取目标节点前一个元音节点vj-1的第二共振峰值F2j-1,获取目标节点后一个元音节点vj+1的第二共振峰值F2j+1,并对目标节点的第二共振峰值F2j进行优化,将优化后的目标节点的第二共振峰值设为F2j’,F2j’=w1×F2j+w2×F2j-1+w3×F2j+1;所述w1为当前元音自身权重因子,所述w2为前向影响权重因子,所述w3为后向影响权重因子。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京思麦力传媒科技有限公司,其通讯地址为:100076 北京市大兴区经济技术开发区文化园西路8号院1号楼8层909;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。