北京邮电大学;北京分音塔科技有限公司杜文强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学;北京分音塔科技有限公司申请的专利一种自定义关键词检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120510838B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510998311.X,技术领域涉及:G10L15/02;该发明授权一种自定义关键词检测方法及系统是由杜文强;李蓝天;郭莉;张明;高欣然设计研发完成,并于2025-07-21向国家知识产权局提交的专利申请。
本一种自定义关键词检测方法及系统在说明书摘要公布了:本发明提供了一种自定义关键词检测方法及系统,包括:获取原始音频数据和关键词文本;所述原始音频数据为多人混叠语音数据;分别对所述原始音频数据和所述关键词文本进行特征提取,得到语音特征和关键词文本特征;将所述语音特征和所述关键词文本特征作为同一向量空间的模型嵌入,通过融合自动语音识别ASR技术与关键词检测KWS技术的交叉注意力机制,在所述原始音频数据识别所述关键词文本和或定位所述关键词文本位置。通过本发明,提出一种基于交叉注意力机制的快速自定义关键词检测方案,基于音素级位置预测与动态掩码生成,实现从混叠语音中提取目标语音片段并精准检测关键词的技术突破,显著提升了复杂场景下的检测鲁棒性。
本发明授权一种自定义关键词检测方法及系统在权利要求书中公布了:1.一种自定义关键词检测方法,其特征在于,所述方法包括: 获取原始音频数据和关键词文本;所述原始音频数据为多人混叠语音数据; 分别对所述原始音频数据和所述关键词文本进行特征提取,得到语音特征和关键词文本特征; 将所述语音特征和所述关键词文本特征作为同一向量空间的模型嵌入,通过融合自动语音识别ASR技术与关键词检测KWS技术的交叉注意力机制,在所述原始音频数据识别所述关键词文本和或定位所述关键词文本位置,包括: 通过所述语音特征针对所述关键词文本特征的交叉注意力机制,提取所述原始音频数据中与所述关键词文本相关的目标语音片段,得到目标语音特征,并预测所述目标语音片段中所述关键词文本的位置范围,包括: 在所述目标语音片段的文本标注中插入起始位置标注符号和终止位置标注符号; 将所述关键词文本的起始位置和终止位置预测建模为音素级任务,通过交叉注意力机制增强所述标注符号概率分布的准确性; 通过所述关键词文本特征针对所述目标语音特征的局部交叉注意力机制,在所述位置范围中聚焦所述关键词文本,以确定所述关键词文本是否存在于所述原始音频数据中,包括: 引入所述关键词文本的起始位置和终止位置形成的范围作为掩码,以约束注意力权重仅聚焦于所述目标语音片段; 利用对角掩码,引导注意力沿所述关键词文本与所述目标语音片段的时间顺序聚焦,以进一步约束所述关键词文本中的每个音素的注意力权重仅聚焦在所述目标语音片段的相应位置上; 计算所述关键词文本出现在所述目标语音片段中的概率,根据所述概率确定所述关键词文本是否存在于所述原始音频数据中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学;北京分音塔科技有限公司,其通讯地址为:100080 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励