Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 苏州大学陈雪勤获国家专利权

苏州大学陈雪勤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉苏州大学申请的专利一种面向真实场景的说话人识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119314493B

龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411847687.2,技术领域涉及:G10L17/02;该发明授权一种面向真实场景的说话人识别方法及系统是由陈雪勤;张德露设计研发完成,并于2024-12-16向国家知识产权局提交的专利申请。

一种面向真实场景的说话人识别方法及系统在说明书摘要公布了:本发明涉及说话人识别技术领域,公开了一种面向真实场景的说话人识别方法及系统,包括:获取外界的声音信息,通过多分辨率卷积核进行处理,在时域上提取特征并仅在时域上进行特征融合;在时域上特征融合后,利用分组卷积在频域上提取特征,进行处理和仅在频域上进行特征融合;在频域特征融合后,进行掩码处理,最终输出识别结果。通过噪声掩码模块和多分辨率特征提取,增强了目标说话人特征的提取,减少了噪声对识别结果的影响。同时,在复杂噪声环境中,系统能够有效聚焦于目标说话人,提升识别的稳定性和可靠性。通过时域和频域的多尺度特征提取,提供了更全面的特征信息,有助于捕捉说话人的细微差异。

本发明授权一种面向真实场景的说话人识别方法及系统在权利要求书中公布了:1.一种面向真实场景的说话人识别方法,其特征在于,包括: 获取外界的声音信息,通过多分辨率卷积核进行处理,在时域上提取特征并仅在时域上进行特征融合; 在时域上特征融合后,利用分组卷积在频域上提取特征,进行处理并仅在频域上进行特征融合; 在频域特征融合后,进行掩码处理,最终输出识别结果; 所述多分辨率卷积核包括;设置三个不同尺度的平行分支滤波器,每个分支由两层一维卷积组成; 第一层一维卷积用于初级滤波,第二层一维卷积用于维度匹配; 在时域上进行特征融合包括:通过不同的卷积核大小和步长,在不同时间分辨率上提取特征,将三个不同时间分辨率的特征沿通道维度拼接; 找到最小的时间步长并裁剪所有特征,使所有特征时间步长相同; 在频域上提取特征包括:将输入的频率通道特征分为4组,得到四个分组子集X1,X2,X3,X4; 第一个子集为X1,得到输出为Y1; 第二个子集为X2,通过7×7的卷积核处理,捕获更广的上下文信息,输出为Y2; 第三个子集为X3,将Y2与X3相加,使用5×5的卷积核进行处理,得到输出Y3; 第四个子集为X4,将Y3与X4相加,使用3×3的卷积核进行处理,得到输出Y4; 通过在频率通道维度上对Y1,Y2,Y3,Y4进行特征拼接,将合并后的特征向量输入到分类器中,通过激活和归一化处理输出最终的说话人识别结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215000 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。