当前位置 : 首页 > 专利喜报 > 武汉大学任延珍获国家专利权

武汉大学任延珍获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉武汉大学申请的专利一种基于分组特征校准的声音事件检测方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116778919B 。

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310672434.5，技术领域涉及：G10L15/16；该发明授权一种基于分组特征校准的声音事件检测方法及系统是由任延珍;刘晨雨;刘武洋设计研发完成，并于2023-06-07向国家知识产权局提交的专利申请。

本一种基于分组特征校准的声音事件检测方法及系统在说明书摘要公布了：本发明提供一种基于分组特征校准的声音事件检测方法及系统，包括：获取待检测声音事件的音频特征数据；将音频特征数据输入时频学习网络，通过卷积神经网络获取时频谱图，基于多个维度对时频谱图的中间表征进行分组特征学习得到分组强化特征，对分组强化特征进行任务感知激活得到自适应特征；将自适应特征输入上下文建模网络，获取音频信号时域相关性特征，对音频信号时域相关性特征进行分类，得到声音事件类别检测结果。本发明根据声音事件检测任务中不同类型音频的时频特性引入分组特征校准模块，增强了声音事件检测网络对各类音频的特征表示能力，参数量小且通用性强，以较小的计算代价引入现有的主流声音事件检测模型中并提升其性能。

本发明授权一种基于分组特征校准的声音事件检测方法及系统在权利要求书中公布了：1.一种基于分组特征校准的声音事件检测方法，其特征在于，包括：获取待检测声音事件的音频特征数据；将所述音频特征数据输入时频学习网络，通过卷积神经网络获取时频谱图，基于多个维度对所述时频谱图的中间表征进行分组特征学习得到分组强化特征，对所述分组强化特征进行任务感知激活得到自适应特征；将所述自适应特征输入上下文建模网络，获取音频信号时域相关性特征，对所述音频信号时域相关性特征进行分类，得到声音事件类别检测结果；基于多个维度对所述时频谱图的中间表征进行分组特征学习得到分组强化特征，包括：获取所述时频谱图的任一训练数据，确定所述任一训练数据通过中间特征表示层输出的特征张量包括通道维数、时间维数和频率维数；基于所述通道维数，按照预设比例将所述特征张量划分为待校准特征和保留特征；将所述待校准特征基于所述通道维数平均划分为时域待校准特征、频域待校准特征、全局待校准特征和局部待校准特征；分别对所述时域待校准特征、所述频域待校准特征、所述全局待校准特征和所述局部待校准特征进行特征学习和重加权，得到分组校准特征；连接所述分组校准特征与所述保留特征，得到所述分组强化特征；对所述分组强化特征进行任务感知激活得到自适应特征，包括：将所述分组强化特征拆分为正数特征和负数特征，由全局池化将所述正数特征和所述负数特征的频率维数和时间维数压缩至一维，得到压缩后正数特征和压缩后负数特征；基于通道维数连接所述压缩后正数特征和所述压缩后负数特征得到连接特征，将所述连接特征输入挤压激励结构得到激励特征；按照通道维数对所述激励特征进行拆分，得到正数特征权重和负数特征权重；将所述正数特征与所述正数特征权重相乘后，加上所述负数特征与负数特征权重的乘积，得到所述自适应特征。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人武汉大学，其通讯地址为：430072 湖北省武汉市武昌区八一路299号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

武汉大学任延珍获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务