宁波极科信息科技有限公司孙世芳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉宁波极科信息科技有限公司申请的专利一种基于生成对抗网络的音频重压缩反取证方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115762560B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211382492.6,技术领域涉及:G10L21/057;该发明授权一种基于生成对抗网络的音频重压缩反取证方法是由孙世芳设计研发完成,并于2022-11-02向国家知识产权局提交的专利申请。
本一种基于生成对抗网络的音频重压缩反取证方法在说明书摘要公布了:本发明公开了一种基于生成对抗网络的音频重压缩反取证方法,其在训练阶段先使用训练集对生成器进行单独网络训练5个轮次,再使用训练集对生成器和判别器进行对抗训练至少30个轮次,在生成器和判别器对抗训练至少30个轮次后停止对抗训练,最终训练得到生成器模型和判别器模型,并保存生成器模型的参数,在对抗训练过程中若当前轮次判别器输出的代表真的分类概率与代表假的分类概率接近,那么提前停止对抗训练;在测试阶段,任意给定一个经过重压缩后再解压得到的解压音频作为测试音频;然后利用生成器模型对测试音频进行测试,生成器模型输出测试音频对应的反取证音频;优点是其能够很好地抹除重压缩痕迹,同时能够保证良好的音频感知质量。
本发明授权一种基于生成对抗网络的音频重压缩反取证方法在权利要求书中公布了:1.一种基于生成对抗网络的音频重压缩反取证方法,包括训练阶段和测试阶段,其特征在于所述的训练阶段的具体过程如下: 步骤1_1:构建一个训练集,训练集中包含数个未经过压缩的原始音频及每个原始音频经过重压缩后再解压得到的解压音频;并构建一个生成器和一个判别器;其中,原始音频和解压音频的采样率为8K; 步骤1_2:设定采用Adam优化器对生成器和判别器的权重与参数进行优化更新,并设定生成器的学习率为1×10-4、判别器的学习率为1×10-5; 步骤1_3:使用训练集对生成器进行单独网络训练5个轮次:将训练集中的每个解压音频输入到生成器中进行网络训练,每轮网络训练结束生成器输出对应的对抗样本,并先后计算听觉感知损失和生成器的损失函数值,对应记为Lossaudi和LossG,LossG=α×Lossaudi+β×Lossadv;其中,对抗样本的采样率为8K,Numsamp表示采样点数,Numsamp=8000,1≤i≤Numsamp,符号“||”为取绝对值符号,xorg,i表示训练集中的每个原始音频xorg的第i个采样点,x'db,i表示训练集中的每个解压音频xdb输入到生成器中进行网络训练生成器输出的对应的对抗样本x'db的第i个采样点,α表示Lossaudi的权重,β表示Lossadv的权重,生成器单独网络训练时α=1000且β=0,Lossadv表示对抗性损失; 步骤1_4:在生成器单独网络训练5个轮次结束后,使用训练集对生成器和判别器进行对抗训练至少30个轮次:将训练集中的每个解压音频输入到生成器中进行网络训练,每轮网络训练结束生成器输出对应的对抗样本,并计算听觉感知损失,记为Lossaudi,然后将训练集中的每个解压音频对应的对抗样本输入到判别器中进行网络训练,同样将训练集中的每个原始音频输入到判别器中进行网络训练,每轮网络训练结束判别器输出每个对抗样本所对应的一个代表真的分类概率和一个代表假的分类概率以及每个原始音频所对应的一个代表真的分类概率和一个代表假的分类概率,并计算对抗性损失,记为Lossadv,在每轮对抗训练结束后,先计算判别器的损失函数值,记为LossD,后计算生成器的损失函数值,记为LossG,LossG=α×Lossaudi+β×Lossadv;其中,D表示判别器,j=1时Dx'dbj表示训练集中的每个解压音频xdb对应的对抗样本x'db输入到判别器中进行网络训练判别器输出的代表真的分类概率,j=2时Dx'dbj表示训练集中的每个解压音频xdb对应的对抗样本x'db输入到判别器中进行网络训练判别器输出的代表假的分类概率,j=1时Dxorgj表示训练集中的每个原始音频xorg输入到判别器中进行网络训练判别器输出的代表真的分类概率,j=2时Dxorgj表示训练集中的每个原始音频xorg输入到判别器中进行网络训练判别器输出的代表假的分类概率,在生成器和判别器对抗训练时α=1000且β=1,生成器与判别器在对抗训练中的迭代比设定为1:5; 步骤1_5:在生成器和判别器对抗训练至少30个轮次后停止对抗训练,最终训练得到生成器模型和判别器模型,并保存生成器模型的参数;其中,在对抗训练过程中若当前轮次判别器输出的代表真的分类概率与代表假的分类概率接近,那么提前停止对抗训练; 所述的测试阶段的具体过程如下: 任意给定一个经过重压缩后再解压得到的解压音频作为测试音频;然后利用生成器模型对测试音频进行测试,生成器模型输出测试音频对应的反取证音频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宁波极科信息科技有限公司,其通讯地址为:315040 浙江省宁波市高新区院士路66号创业大厦602室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。