东南大学丁祉涵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120783770B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511286311.3,技术领域涉及:G10L19/005;该发明授权基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法及设备是由丁祉涵;景康祺;闫桐嘉;周琳设计研发完成,并于2025-09-10向国家知识产权局提交的专利申请。
本基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法及设备在说明书摘要公布了:本发明公开了一种基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法及设备,包括:采用完整语音信号和对应丢包语音信号形成成训练集;构建基于改进离散余弦变换域生成对抗网络,具体包括:改进离散余弦变换域特征提取模块、基于双路径循环卷积的生成器网络、改进离散余弦反变换模块、鉴别器网络、损失函数计算模块,生成器网络具体包括依次连接的编码器模块、双路径长短期记忆网络LSTM模块和解码器模块,编码器模块包括若干层编码器层,解码器模块包括若干层解码器层,各编、解码器层之间采用SimAM注意力模块连接;采用训练集对生成对抗网络进行训练,然后基于训练好的网络进行丢包补偿。本发明补偿效果更好。
本发明授权基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法及设备在权利要求书中公布了:1.一种基于改进离散余弦变换域生成对抗模型的语音丢包补偿方法,其特征在于,包括: 步骤1、对完整语音信号通过处理得到丢包语音信号,将若干完整语音信号和对应丢包语音信号组成样本对,构成训练数据集; 步骤2、构建基于改进离散余弦变换域生成对抗网络,具体包括: 改进离散余弦变换域特征提取模块,用于通过对丢包语音信号进行改进离散余弦变换,提取丢包语音信号的时频域特征; 基于双路径循环卷积的生成器网络,用于利用丢包语音信号的时频域特征对丢包语音信号补偿,生成伪完整语音信号的特征;生成器网络具体包括依次连接的编码器模块、双路径长短期记忆网络LSTM模块和解码器模块,编码器模块包括若干层编码器层,解码器模块包括若干层解码器层,各编、解码器层之间采用SimAM注意力模块连接; 改进离散余弦反变换模块,用于对伪完整语音信号的特征进行改进离散余弦反变换,得到伪完整语音信号; 鉴别器网络,用于将完整语音信号与伪完整语音信号进行真伪鉴别; 损失函数计算模块,用于将生成器网络损失、时域的MAE损失、改进离散余弦变换损失、语音质量感知评估损失进行结合,计算总损失,从而对生成器网络的参数更新; 步骤3、将所述训练数据集输入所述基于改进离散余弦变换域生成对抗网络,进行网络训练; 步骤4、将待测试的丢包语音信号输入训练好的网络,得到补偿后的完整语音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励