Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海墨百意信息科技有限公司秦秀元获国家专利权

上海墨百意信息科技有限公司秦秀元获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海墨百意信息科技有限公司申请的专利多风格语音的生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116705000B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310884051.4,技术领域涉及:G10L13/08;该发明授权多风格语音的生成方法及装置是由秦秀元;殷昊;田锋平设计研发完成,并于2023-07-18向国家知识产权局提交的专利申请。

多风格语音的生成方法及装置在说明书摘要公布了:本公开提供了一种多风格语音的生成方法及装置,该方法先获取音频样本的风格特征,进而得到特征类型和损失值,通过损失值来更新模型参数,采用自适应特征迁移技术进行风格特征的迁移从而实现风格语音合成,在确保模型性能的前提下,有效降低了模型训练的复杂度和模型训练时使用的数据量,在语音合成中对不同风格进行建模,同时使用多说话人语音合成技术,可以对同一句话分别合成不同的风格,切换不同的第二音频作为输入,就可以实现多种风格的迁移,从而将不同风格特征迁移至任意一个无标注的发音人,在不降低语音合成质量的同时,提高了合成语音的自然度和表现力。

本发明授权多风格语音的生成方法及装置在权利要求书中公布了:1.一种多风格语音的生成方法,其特征在于,包括: 通过风格特征提取模块获取训练集中所有音频样本的风格特征; 对所有获取到的风格特征进行聚类得到多种风格特征类型; 通过神经网络声码器得到所述音频样本的语义特征,并依据所述语义特征和所述风格特征得到第一损失值; 确定与所述音频样本相应的风格特征和所述多种风格特征类型之间的距离,并依据对比损失函数计算与所述距离对应的距离损失值; 依据综合损失值更新风格迁移模块的参数以使所述距离变小,直至达到收敛条件,得到训练好的语音风格迁移模型,所述综合损失值包括所述第一损失值和所述距离损失值,所述语音风格迁移模型包括所述神经网络声码器和所述风格迁移模块,所述风格迁移模块包括所述风格特征提取模块;以及 将第一音频输入所述神经网络声码器,并将第二音频输入所述风格特征提取模块,得到合成音频,所述合成音频的文本内容对应所述第一音频且音频风格对应所述第二音频; 所述通过神经网络声码器得到所述音频样本的语义特征,包括:将所述音频样本的频谱输入至神经网络声码器得到语义特征; 所述将所述音频样本的频谱输入至神经网络声码器得到语义特征,包括:对将所述音频样本的频谱进行一维卷积,得到第一卷积结果;以及对所述第一卷积结果进行N次的抗锯齿多周期合成操作,得到语义特征,每次所述抗锯齿多周期合成操作包括依次进行一维转置卷积和抗锯齿多周期合成运算;第N次抗锯齿多周期合成操作的输出即为语义特征; 所述依据所述语义特征和所述风格特征得到第一损失值,包括:将所述语义特征和所述风格特征进行矩阵相加得到待处理特征;以及对所述待处理特征进行非线性化处理得到第一损失值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海墨百意信息科技有限公司,其通讯地址为:200232 上海市徐汇区丰谷路315弄24号2层2015室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。