渊慧科技有限公司杰弗里·多纳休获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉渊慧科技有限公司申请的专利利用对抗网络使用未对准文本输入生成音频数据获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115427973B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202180029235.1,技术领域涉及:G06N3/045;该发明授权利用对抗网络使用未对准文本输入生成音频数据是由杰弗里·多纳休;凯伦·西蒙尼扬;桑德尔·艾蒂恩内·利·迪勒曼;米科拉伊·宾科夫斯基;埃里克·康拉德·埃尔森设计研发完成,并于2021-06-07向国家知识产权局提交的专利申请。
本利用对抗网络使用未对准文本输入生成音频数据在说明书摘要公布了:用于使用生成神经网络将条件文本输入转换为音频输出的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。生成神经网络包括对准神经网络,所述对准神经网络被配置为接收包括条件文本输入的生成输入并且处理生成输入以生成对准条件序列,所述对准条件序列在多个第一时间步长中的每个第一时间步长处包括相应特征表示并且与音频输出在时间上对准。
本发明授权利用对抗网络使用未对准文本输入生成音频数据在权利要求书中公布了:1.一种训练前馈生成神经网络的计算机实施的方法,所述前馈生成神经网络具有多个生成参数并且被配置为使用条件文本输入来生成音频输出, 其中,每个条件文本输入包括多个输入时间步长中的每个输入时间步长处的相应语言特征表示, 其中,所述前馈生成神经网络被配置为接收包括所述条件文本输入的生成输入并且处理所述生成输入以生成音频输出,所述音频输出包括多个输出时间步长中的每个输出时间步长处的相应音频样本,并且 其中,所述训练包括,针对训练条件文本输入中的每一个: 获得训练条件文本输入; 根据所述生成参数的当前值使用所述前馈生成神经网络处理包括所述训练条件文本输入的训练生成输入以生成训练音频输出,所述处理包括: 使用对准神经网络处理所述训练生成输入,以生成包括在多个第一时间步长中的每个第一时间步长处的相应特征表示的对准条件序列,所述对准神经网络包括第一子网和第二子网;以及 使用生成器神经网络处理所述对准条件序列,以生成所述训练音频输出; 使用一个或多个鉴别器中的每个鉴别器处理所述训练音频输出,其中,每个鉴别器预测所述训练音频输出是真实音频示例还是合成音频示例; 使用所述一个或多个鉴别器的相应预测来确定最终预测;以及 确定对所述生成参数的所述当前值的更新,以增加所述最终预测的第一误差, 其中,使用所述对准神经网络处理所述训练生成输入包括: 使用所述第一子网处理所述训练生成输入,以生成在多个中间时间步长中的每个中间时间步长处具有相应中间元素的中间序列; 使用所述第二子网处理所述中间序列,以针对每个中间元素生成表征该中间元素的预测时间长度的长度预测;以及 处理相应长度预测以生成所述对准条件序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人渊慧科技有限公司,其通讯地址为:英国伦敦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励