中国人民解放军国防科技大学古斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利一种通信场景下基于通道注意力的说话人识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120220694B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510625594.3,技术领域涉及:G10L17/18;该发明授权一种通信场景下基于通道注意力的说话人识别方法是由古斌;赵海涛;熊俊;张亦弛;段伟国;李威;魏急波设计研发完成,并于2025-05-15向国家知识产权局提交的专利申请。
本一种通信场景下基于通道注意力的说话人识别方法在说明书摘要公布了:本申请涉及一种通信场景下基于通道注意力的说话人识别方法。所述方法包括:构建说话人识别模型,该模型包括依次连接的表征提取主干网络与说话人分类网络;将基于跨网络层特征聚合的通道注意力机制,以多个通道注意力网络模块的形式嵌入到表征提取主干网络中,该通道注意力网络模块包括可学习字典编码单元和信息聚合单元;对嵌入有通道注意力网络模块的说话人识别模型进行优化训练,并采用训练好的说话人识别模型执行通信场景下的说话人识别任务。本方法能够通过多层次地表示隐层特征信息,精准感知网络中各通道特征重要性,从而更加高效地进行特征选择和差异化建模,对于提升说话人表征的区分性与说话人识别的准确度具有重要价值。
本发明授权一种通信场景下基于通道注意力的说话人识别方法在权利要求书中公布了:1.一种通信场景下基于通道注意力的说话人识别方法,其特征在于,所述方法包括: 构建说话人识别模型,该模型由依次连接的表征提取主干网络与说话人分类网络组成; 将基于跨网络层特征聚合的通道注意力机制,以多个通道注意力网络模块的形式嵌入到所述表征提取主干网络中;所述通道注意力网络模块包括可学习字典编码单元和信息聚合单元;其中,所述可学习字典编码单元旨在获取模型中特定网络层内特征的全面表示,用于对前一网络层输入的声学特征进行编码,得到编码向量;所述信息聚合单元旨在获取模型中跨网络层特征的全局信息表示,用于对多个网络层的编码向量进行聚合,得到当前网络层的全局通道信息表示,并根据所述全局通道信息表示计算得到的缩放系数和平移系数,对前一网络层输入的声学特征进行特征校准,并将校准后的声学特征作为下一网络层的输入; 获取说话人语音数据集,并输入至嵌入有通道注意力网络模块的说话人识别模型进行优化训练,模型参数由说话人分类网络配合计算损失并优化更新,直至得到训练好的说话人识别模型; 采用训练好的说话人识别模型执行通信场景下的说话人识别任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。