重庆邮电大学钱鹰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于生成对抗网络的合成语音检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115985340B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210997349.1,技术领域涉及:G10L25/48;该发明授权一种基于生成对抗网络的合成语音检测方法及系统是由钱鹰;谭旭东;万邦睿;刘歆;陈雪设计研发完成,并于2022-08-19向国家知识产权局提交的专利申请。
本一种基于生成对抗网络的合成语音检测方法及系统在说明书摘要公布了:本发明属于网络安全‑‑合成语音检测领域,具体涉及一种基于生成对抗网络的合成语音检测方法及系统,该方法包括获取待检测的语音数据,对语音数据进行预处理;采用训练好的语音检测模型对预处理后的语音数据进行检测,得到检测结果,对检测结果进行分类标记,所述语音检测模型为生成对抗网络;本发明利用生成对抗网络模型的博弈学习思想最终达到良好的合成语音检测效果,结合了自然语言处理技术对期望文本进行分词处理以及情感分析,其次采用了编码器对注音字符进行特征提取得到隐藏特征,再将其送入多头注意力机制,最后将隐藏特征解码,重构出更贴近目标对象的合成语音向量,提高了检测的准确度。
本发明授权一种基于生成对抗网络的合成语音检测方法及系统在权利要求书中公布了:1.一种基于生成对抗网络的合成语音检测方法,其特征在于,包括:获取待检测的语音数据,对语音数据进行预处理;采用训练好的语音检测模型对预处理后的语音数据进行检测,得到检测结果,对检测结果进行分类标记;所述语音检测模型为生成对抗网络; 对语音检测模型进行训练的过程包括: S1:获取训练集,训练集中的数据包括期望文本以及语音素材; S2:将训练集中的期望文本进行自然语言情感分析处理,得到注音字符;其中进行自然语言情感分析处理包括对期望文本进行词法分析、句法分析、语义分析以及语境解析,得到情感词,并将情感词转化为注音字符; S3:采用第一卷积神经网络对注音字符进行特征提取,并通过编码器将提取的特征转化为隐藏向量;并采用多头注意力机制对隐藏向量进行处理; 采用多头注意力机制对隐藏向量进行处理的过程包括:多头注意力机制包括至少两个子注意力机制,将经过每个字注意力机制处理的数据进行集合,得到多头注意力机制处理的隐藏向量;每个子注意力输出为: headi=AttentionSWi S+FWi F+B 多头注意力机制的输出为: fhead=concathead1,head2...headnW 其中,headi表示第i个子注意力机制输出结果,Attention表示注意力机制,S、F均为编码器输入,B为偏移量,Wi S、Wi F均为子注意力机制权重值,concat表示将所有子注意力机制函数连接,W为各子注意力机制权重值; S4:对通过多头注意力机制后的隐藏向量进行解码,将解码后的向量输入到第二卷积神经网络中,得到语音声学特征; 对通过多头注意力机制后的隐藏向量进行解码的过程包括:采用解码器将多头注意力机制的输出和上一时刻输出的编码向量做拼接操作,将拼接后的向量输入到LSTM模块中计算新的编码向量;拼接向量的计算公式为: S=St+wsFs*st+Bs 其中,S为拼接向量,St为多头注意力机制输出,Fs为卷积操作,Ws和Bs为待训练的参数; S5:将语音声学特征转化为时域波形,并合成为语音信息; S6:将语音信息与对应的语音素材进行混合,采用对称梅尔倒谱系数对混合后的语音信息进行初步特征提取; S7:采用多尺度深度卷积神经网络对初步特征进行深层次特征提取,得到多尺度特征信息; S8:将多尺度特征进行拼接,得到检测结果; S9:根据检测结果计算模型的损失函数,不断调整模型的参数,当损失函数收敛时,完成模型的训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。