当前位置 : 首页 > 专利喜报 > 北京达佳互联信息技术有限公司张大威获国家专利权

北京达佳互联信息技术有限公司张大威获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉北京达佳互联信息技术有限公司申请的专利发声对象识别方法、装置、服务器及存储介质获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN114512133B 。

龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202011159156.6，技术领域涉及：G10L17/00；该发明授权发声对象识别方法、装置、服务器及存储介质是由张大威;姜涛;王晓瑞;王俊;李岩设计研发完成，并于2020-10-26向国家知识产权局提交的专利申请。

本发声对象识别方法、装置、服务器及存储介质在说明书摘要公布了：本公开关于一种发声对象识别方法、装置、服务器及存储介质。其中，该发声对象识别方法包括：从待识别发声对象的第一语音数据中提取第一语音向量，以及从目标发声对象的第二语音数据中提取第二语音向量；将第一语音向量和第二语音向量输入到声纹特征识别模型，利用声纹特征识别模型中隐藏层的激活函数分别对第一语音向量和第二语音向量进行声纹特征提取，得到待识别发声对象的第一声纹特征和目标发声对象的第二声纹特征；计算第一声纹特征与第二声纹特征之间的相似度；若相似度大于或等于相似度阈值，则确定待识别发声对象与目标发声对象相匹配。能够准确地确定出待识别发声对象与目标发声对象是否相匹配。

本发明授权发声对象识别方法、装置、服务器及存储介质在权利要求书中公布了：1.一种发声对象识别方法，其特征在于，包括：从待识别发声对象的第一语音数据中提取第一语音向量，以及从目标发声对象的第二语音数据中提取第二语音向量；将所述第一语音向量和所述第二语音向量输入到声纹特征识别模型，利用所述声纹特征识别模型中隐藏层的激活函数分别对所述第一语音向量和所述第二语音向量进行声纹特征提取，得到所述待识别发声对象的第一声纹特征和所述目标发声对象的第二声纹特征，所述声纹特征识别模型包括多个级联的隐藏层，所述隐藏层的层数和每层所述隐藏层的隐藏神经元数根据训练样本的数量确定；计算所述第一声纹特征与所述第二声纹特征之间的相似度；若所述相似度大于或等于相似度阈值，则确定所述待识别发声对象与所述目标发声对象相匹配；所述声纹特征识别模型为mini-TDNN；在所述将所述第一语音向量和所述第二语音向量输入到声纹特征识别模型之前，所述方法还包括：获取第一发声对象的第三语音向量及其对应的目标标识信息；根据预设时延参数和所述第三语音向量确定第四语音向量；根据所述第三语音向量和所述第四语音向量确定目标语音向量，所述预设时延参数为所述mini-TDNN的时延参数，每个所述第三语音向量与一帧音频相对应；将所述目标语音向量输入到所述声纹特征识别模型，以使所述声纹特征识别模型的第一隐藏层利用激活函数对所述目标语音向量进行声纹特征提取，得到第一提取结果；将所述第一提取结果作为所述第一隐藏层的下一层隐藏层的输入，并利用所述下一层隐藏层的激活函数对所述第一提取结果进行声纹特征提取，得到第二提取结果，依此类推，直至达到所述声纹特征识别模型的预设隐藏层，所述预设隐藏层输出与所述第三语音向量对应的第三声纹特征；根据所述第三声纹特征及其对应的目标标识信息，训练所述声纹特征识别模型。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司，其通讯地址为：100085 北京市海淀区上地西路6号1幢1层101D1-7；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

北京达佳互联信息技术有限公司张大威获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务