湖南真通智用人工智能科技有限公司陈海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南真通智用人工智能科技有限公司申请的专利一种多人重叠语音实时声纹识别方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121545529B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610057976.5,技术领域涉及:G10L17/08;该发明授权一种多人重叠语音实时声纹识别方法与系统是由陈海涛;欧阳芬;王明设计研发完成,并于2026-01-16向国家知识产权局提交的专利申请。
本一种多人重叠语音实时声纹识别方法与系统在说明书摘要公布了:本发明涉及声纹识别与语音转写领域,公开了一种多人重叠语音实时声纹识别方法与系统。该方法包括:获取多源音频流并进行标准化与分帧处理,生成流式音频帧序列;基于该序列,通过循环缓冲、降噪、端点检测和重叠检测模型处理,得到重叠区间标注;进而进行任务装配、说话人分离、轨道编号及声纹特征提取与身份判定,生成轨道身份绑定结构;最终执行语音转写、片段拼接与冲突裁剪,并更新声纹模板库。本发明实现了对多人重叠语音的实时分离与身份识别,有效提升了复杂场景下声纹识别的准确性与鲁棒性。
本发明授权一种多人重叠语音实时声纹识别方法与系统在权利要求书中公布了:1.一种多人重叠语音实时声纹识别方法,其特征在于,包括: S100、获取多源设备音频流采集配置结构与多源设备音频流集合,进行脉冲编码调制编码统一与固定时长分帧处理,生成流式音频帧序列结构;其中,为每个音频帧赋予帧序号与时间戳;当发生丢包导致时间戳不连续时,在时间戳生成过程中插入缺口标记并写入异常事件记录项; S200、基于所述流式音频帧序列结构,提取语音有效帧集合并执行滑窗遍历重叠检测模型调用处理,得到重叠区间标注结构;其中,当语音有效帧集合包含缺口标记字段时,在区间生成阶段将缺口位置作为区间边界候选点,缺口两侧的区间分别生成并在所述重叠区间标注结构内记录缺口分割标记; S300、基于所述重叠区间标注结构,进行区间处理任务装配、轨道编号处理,并执行声纹特征提取与余弦相似度阈值判定操作,生成轨道身份绑定结构;其中,当存在时间戳缺口标记或区间边界落在缺口范围内时,将该区间标注为缺口敏感区间并写入异常事件记录项,同时按区间边界就近映射原则完成帧索引修正;当轨道音频片段序列中出现缺口标记字段时,将缺口位置记录为轨道中断标记并写入异常事件记录项;当轨道音频片段存在轨道中断标记时,按中断边界切分为多个子片段分别提取轨道声纹特征向量,并在轨道层执行聚合得到轨道聚合声纹特征; S400、基于轨道身份绑定结构,执行语音转写模型推理与片段时间戳绑定,形成片段级记录;当轨道音频片段存在轨道中断标记或缺口标记字段时,在缺口边界处强制切分待转写片段,并在所述片段级记录中写入缺口分割标记。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南真通智用人工智能科技有限公司,其通讯地址为:410000 湖南省长沙市开福区月湖街道匍园路马栏山信息港2号栋2至3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励