Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东声(苏州)智能科技有限公司韩旭获国家专利权

东声(苏州)智能科技有限公司韩旭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东声(苏州)智能科技有限公司申请的专利基于深度学习的声音分类方法和装置、存储介质和计算机获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113963719B

龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010700261.X,技术领域涉及:G10L25/30;该发明授权基于深度学习的声音分类方法和装置、存储介质和计算机是由韩旭;钟亘明设计研发完成,并于2020-07-20向国家知识产权局提交的专利申请。

基于深度学习的声音分类方法和装置、存储介质和计算机在说明书摘要公布了:本发明提供一种声音分类方法和装置、存储介质和计算机。所述声音分类方法包括:提供训练集、验证集以及卷积神经网络模型;通过加窗的方式从样本中得到时域特征和频域特征,将提取的时域特征和频域特征叠加得到该样本的时频组合特征;将基于所述训练集中的训练样本得到的时频组合特征输入至卷积神经网络模型进行训练,将基于所述验证集中的验证样本得到的时频组合特征输入至卷积神经网络模型进行验证,通过多次的训练和验证,得到训练验证后的卷积神经网络模型。这样,使得兼顾频率能量变化的同时,对声音整体的信息也具有较高的识别度,同时也可以提高分类的准确度。

本发明授权基于深度学习的声音分类方法和装置、存储介质和计算机在权利要求书中公布了:1.一种声音分类方法,其特征在于,其包括: 提供训练集、验证集以及卷积神经网络模型,其中所述训练集包括多个训练样本,所述验证集包括一个或多个验证样本,每个样本为一段被标记过的声音数据; 对一个样本加第一窗口,对第一窗口内的声音数据进行计算提取时域特征,对第一窗口内的声音数据加第二窗口,将第二窗口内的声音数据由时域转换至频域后进行频域特征提取,将提取的时域特征和频域特征叠加得到该样本的时频组合特征,第一窗口为矩形窗口,窗口大小为第一预定时长,第二窗口为汉宁窗,第二窗口的大小为第二预定时长,第一预定时长为第二预定时长的N倍,N为大于等于2个整数,将基于第一窗口提取得到的时域特征与基于N个第二窗口提取得到的频域特征组合形成时频组合特征,所述时频组合特征的上部分为频域特征,下部分为时域特征,上部分的N个频域特征按照时间依次排布,与下部分的时域特征按照时间相对应; 将基于所述训练集中的训练样本得到的时频组合特征输入至卷积神经网络模型进行训练,将基于所述验证集中的验证样本得到的时频组合特征输入至卷积神经网络模型进行验证,通过多次的训练和验证,得到训练验证后的卷积神经网络模型, 所述卷积神经网络模型包括依次相连的卷积层、池化层、密集块、全连接层和sigmoid函数层,卷积层和池化层之间依次设置有激活函数层和归一化层,密集块和全连接层之间依次设置有激活函数层和归一化层,所述sigmoid函数层用于将结果收缩在0-1之间, 所述密集块有两个,分别称为第一密集块和第二密集块,所述全连接层有两个,分别称为第一全连接层和第二全连接层,第一密集块与池化层相连,第一密集块和第二密集块之间依次设置有激活函数层和归一化层,第二密集块和第一全连接层之间依次设置有激活函数层和归一化层,第二全连接层连接于第一全连接层后,归一化层用来加快训练,并且突出数据之间的分布差异。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东声(苏州)智能科技有限公司,其通讯地址为:215000 江苏省苏州市苏州工业园区星湖街328号创意产业园8-701单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。