北京搜狐新媒体信息技术有限公司李佳欢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京搜狐新媒体信息技术有限公司申请的专利一种声音复刻方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121281534B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511844410.9,技术领域涉及:G10L21/007;该发明授权一种声音复刻方法及相关装置是由李佳欢设计研发完成,并于2025-12-09向国家知识产权局提交的专利申请。
本一种声音复刻方法及相关装置在说明书摘要公布了:本申请提供了一种声音复刻方法及相关装置,涉及声音处理技术领域。对参考音频进行音频校验,得到第一音频,对所述第一音频进行语音增强操作,实现降噪、去混响、提升音频信噪比的目的,从而得到第二音频,对所述第二音频进行语音活动检测与片段分割操作,得到候选语音片段,从所述候选语音片段中筛选出满足声音复刻需求的目标语音片段,以从候选语音片段中选取音色清晰、信噪比高、发音稳定的最优片段用于音色嵌入提取以及语音生成,降低生成的语音出现音色偏差的概率,提高语音生成的准确度,进而提高用户体验。
本发明授权一种声音复刻方法及相关装置在权利要求书中公布了:1.一种声音复刻方法,其特征在于,包括: 对参考音频进行音频校验,得到第一音频,对所述第一音频进行语音增强操作,得到第二音频; 对所述第二音频进行语音活动检测与片段分割操作,得到候选语音片段,从所述候选语音片段中筛选出满足声音复刻需求的目标语音片段,其中,包括:使用动态阈值、所述第二音频的短时能量以及梅尔倒频谱系数,对所述第二音频进行语音活动检测操作,基于语音活动检测结果对所述第二音频进行分割操作,得到多个包括所述第二音频中的活动语音的候选语音片段,利用所述候选语音片段的音质评估结果以及元音持续时间,从所述候选语音片段中筛选出满足声音复刻需求的目标语音片段;所述音质评估结果为对所述候选语音片段的信噪比、频谱连续性和发音清晰度进行加权融合操作得到;在未从所述候选语音片段中筛选出目标语音片段的情况下,统计所述第二音频中的指定音频帧的梅尔倒频谱系数与梅尔倒频谱系数均值向量之间的欧氏距离的均值和标准差;基于所述第二音频的信噪比,确定自适应调整系数;根据所述均值、所述标准差和所述自适应调整系数,计算新的动态阈值,返回使用动态阈值、所述第二音频的短时能量以及梅尔倒频谱系数,对所述第二音频进行语音活动检测操作的步骤; 对所述目标语音片段进行语音识别操作,得到转录文本; 对用户输入的目标文本进行文本标准化操作,得到标准化文本; 参考所述转录文本,提取所述目标语音片段的音色嵌入; 根据所述音色嵌入,生成所述标准化文本对应的目标语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京搜狐新媒体信息技术有限公司,其通讯地址为:100190 北京市海淀区科学院南路2号院3号楼12层1201;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励