广东省信息网络有限公司乐进获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东省信息网络有限公司申请的专利一种基于角色分离的销售语音对话语者分割与标记方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121034335B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511252515.5,技术领域涉及:G10L21/028;该发明授权一种基于角色分离的销售语音对话语者分割与标记方法是由乐进;王睿;梁天爵设计研发完成,并于2025-09-03向国家知识产权局提交的专利申请。
本一种基于角色分离的销售语音对话语者分割与标记方法在说明书摘要公布了:本发明涉及语音处理技术领域,具体涉及一种基于角色分离的销售语音对话语者分割与标记方法,包括以下步骤:生成带时间戳的语音段序列,同步提取每个语音段的声纹特征向量,启动静默意图分析引擎,根据静默段前后语音段的语义内容预测当前静默的归属角色,生成虚拟声纹特征向量并插入语音段序列;对声纹特征向量进行角色聚类,分裂生成新语者类簇;当检测到语音段中存在说话重叠或音频缺失时,触发混合语音分离与生成式补偿。本发明,提升了对销售角色变换、声线伪装等场景下的异常识别能力,降低了销售与客户语音混淆的风险,确保每一语音段的角色标记连贯准确。
本发明授权一种基于角色分离的销售语音对话语者分割与标记方法在权利要求书中公布了:1.一种基于角色分离的销售语音对话语者分割与标记方法,其特征在于,包括以下步骤: S1:对输入音频流进行语音活动检测与初始分割,生成带时间戳的语音段序列,同步提取每个语音段的声纹特征向量;当检测到连续静默时长超过第一阈值时,启动静默意图分析引擎,根据静默段前后语音段的语义内容预测当前静默的归属角色,生成虚拟声纹特征向量并插入语音段序列; S2:基于动态自适应聚类对所述声纹特征向量进行角色聚类,生成至少两个语者类簇;所述动态自适应聚类包括将声纹特征向量集输入改进的DBSCAN聚类算法,改进的DBSCAN聚类算法包括设定动态邻域半径以及最小样本数,聚类结果生成语者类簇,对于每个聚类结果中的语者类簇,将其内部语音段按时间顺序排列,监测语者类簇内相邻语音段并基于余弦相似度计算声纹相似度,若单语者类簇内相邻语音段的声纹相似度满足相似度骤降双重判定条件,则分裂生成新语者类簇,并保留剥离新语者类簇的剩余原语音类簇,相似度骤降双重判定条件包括声纹相似度低于第二阈值以及相似度变化幅度显著; 通过销售特征词检测引擎识别包括预设销售术语的语音段,将当前语者类簇绑定为销售角色标签,否则标记为客户角色标签;针对分裂生成的新语者类簇,启动跨话轮角色重绑定:若新语者类簇中语音段与历史销售角色语音存在语义连贯性,则继承销售角色标签; S3:当检测到语音段中存在说话重叠或音频缺失时,触发混合语音分离与生成式补偿: 对说话重叠段进行声源分离得到纯净单角色子段; 对音频缺失段采用上下文关联的语音生成补全内容; 将处理后的子段按S2输出的角色标签插入原语音段序列,输出带角色标记的完整对话文本流。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东省信息网络有限公司,其通讯地址为:510000 广东省广州市越秀区北较场横路12号物资大厦14楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励