微软技术许可有限责任公司E·C·W·索默拉德获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉微软技术许可有限责任公司申请的专利使用合成图像特征来对音频场景进行分类获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115004299B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080093349.8,技术领域涉及:G10L25/51;该发明授权使用合成图像特征来对音频场景进行分类是由E·C·W·索默拉德;Y·刘;A·尼奥菲图;S·森古普塔设计研发完成,并于2020-11-24向国家知识产权局提交的专利申请。
本使用合成图像特征来对音频场景进行分类在说明书摘要公布了:一种计算系统包括接收输入图像并将该输入图像编码成真实图像特征的编码器;将该真实图像特征解码成经重构图像的解码器;生成器,该生成器接收对应于该输入图像的第一音频数据并从该第一音频数据中生成第一合成图像特征,并且接收第二音频数据并从该第二音频数据中生成第二合成图像特征;鉴别器,该鉴别器接收真实和合成图像特征这两者并确定目标特征是真实的还是合成的;以及分类器,该分类器基于第二合成图像特征来对第二音频数据的场景进行分类。
本发明授权使用合成图像特征来对音频场景进行分类在权利要求书中公布了:1.一种计算系统,包括: 具有存储指令的相关联的存储器的处理器,所述指令使所述处理器对多个输入图像中的每一者在训练时执行: 编码器,所述编码器被配置成接收所述多个输入图像中的一个输入图像并将所述输入图像编码成真实图像特征; 解码器,所述解码器被配置成从所述编码器接收所述真实图像特征并将所述真实图像特征解码成经重构图像; 生成器,所述生成器被配置成接收对应于所述输入图像的第一音频数据并从所述第一音频数据中生成第一合成图像特征,并且接收第二音频数据并从所述第二音频数据中生成第二合成图像特征; 鉴别器,所述鉴别器被配置成接收所述真实图像特征和第一合成图像特征并输出对目标特征是真实的还是合成的确定;以及分类器,所述分类器被配置成接收所述第二合成图像特征并基于所述第二合成图像特征来对所述第二音频数据的场景进行分类; 其中所述解码器被进一步配置成从所述第一合成图像特征中构造第一合成图像并从所述第二合成图像特征中构造第二合成图像; 其中所述处理器被进一步配置成循环进行以下操作: 训练所述编码器和所述解码器以提高所述经重构图像和所述第一合成图像中的每一者与相应输入图像的相关性; 基于所述鉴别器输出的所述确定来训练所述生成器;以及在所述编码器被固定时训练所述鉴别器; 其中所述处理器被进一步配置成在所述编码器、解码器、生成器和鉴别器被固定时训练所述分类器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人微软技术许可有限责任公司,其通讯地址为:美国华盛顿州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励