Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京科技大学宋睿卓获国家专利权

北京科技大学宋睿卓获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京科技大学申请的专利一种基于神经网络模型的多声音事件检测定位方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120544597B

龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510880793.9,技术领域涉及:G10L25/30;该发明授权一种基于神经网络模型的多声音事件检测定位方法及装置是由宋睿卓;温可新;夏丽娜设计研发完成,并于2025-06-27向国家知识产权局提交的专利申请。

一种基于神经网络模型的多声音事件检测定位方法及装置在说明书摘要公布了:本发明涉及人工智能技术领域,特别涉及一种基于神经网络模型的多声音事件检测定位方法及装置。方法包括:创新设计时间‑频率多尺度残差卷积块,与Conformer模块和十字绣单元模块组成网络模型,多尺度提取特征、加强长序列建模及促进任务协同优化,提升性能与准确性;数据处理方面,预加重、分帧加窗提升特征质量,音频通道交换与频谱增强增加数据多样性,减少过拟合,采用SALSA‑Lite特征增强了特征表达;训练策略上,运用多元损失函数兼顾任务需求加速收敛,借助验证集灵活调整超参数。这使得本方法训练效率高、实际性能优,在未知数据上泛化能力强,能精准应对复杂多变的实际场景,有效克服传统方法的不足。

本发明授权一种基于神经网络模型的多声音事件检测定位方法及装置在权利要求书中公布了:1.一种基于神经网络模型的多声音事件检测定位方法,其特征在于,所述方法包括: S1、构建音频数据集,并将音频数据集拆分为训练集、验证集和测试集;对音频数据集中的音频数据进行预处理,获得音频数据集中音频数据的SALSA-Lite特征; S2、构建多声源检测与定位神经网络模型,将训练集的SALSA-Lite特征输入至多声源检测与定位神经网络模型,进行声音检测和方位估计的训练; 多声源检测与定位神经网络模型,包括: 多声源检测与定位设计的时间-频率多尺度残差卷积块、Conformer模块以及用于检测和定位任务相互学习的十字绣单元模块; 其中,时间-频率多尺度残差卷积包括结合时间轴与频率轴卷积的多尺度卷积层、ReLU激活函数、普通卷积层与批量归一化层,同时设有下采样模块用于处理输入输出通道数或步长不一致的情况,最后将输出与残差分支相加并通过ReLU激活函数输出; S3、通过二元交叉熵损失函数、均方误差损失函数和联合损失函数训练多声源检测与定位神经网络模型,联合损失函数将二元交叉熵损失函数和均方误差损失函数进行加权组合; S4、使用训练好的多声源检测与定位神经网络模型对验证集的SALSA-Lite特征进行预测,得到声音检测结果和方位估计结果;计算验证集上的评估指标,评估模型在验证集上的性能;根据验证集的评估结果,调整模型的超参数,获得调优后的多声源检测与定位神经网络模型; S5、通过调优后的多声源检测与定位神经网络模型,对测试集的SALSA-Lite特征进行预测,得到最终的声音检测结果和方位估计结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。