科大讯飞股份有限公司江坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利语音唤醒方法、装置、电子设备、存储介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126455B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510593799.8,技术领域涉及:G10L15/02;该发明授权语音唤醒方法、装置、电子设备、存储介质和程序产品是由江坤;王磊磊;戴亮;卢晶晶设计研发完成,并于2025-05-09向国家知识产权局提交的专利申请。
本语音唤醒方法、装置、电子设备、存储介质和程序产品在说明书摘要公布了:本发明提供一种语音唤醒方法、装置、电子设备、存储介质和程序产品,涉及声学信号处理技术领域。该方法包括:将音频数据中各音频数据帧输入至声学模型,得到声学模型输出的音素级状态序列;基于音素级状态序列,确定是否为语音唤醒状态。本发明中的声学模型是基于第一样本音频数据帧及其对应的混合音素状态标签,对已训练模型中的分类层进行优化得到的,且混合音素状态标签包括唤醒状态对应的三音素状态,以及非唤醒状态对应的单音素状态,从而只需对应音素为唤醒状态才需要标注三音素状态,否则只需标注状态数更少的单音素状态,从而降低声学模型输出的状态数,进而降低声学模型所需的资源要求,确保语音唤醒方法可以应用于低功耗设备。
本发明授权语音唤醒方法、装置、电子设备、存储介质和程序产品在权利要求书中公布了:1.一种语音唤醒方法,其特征在于,包括: 将音频数据中各音频数据帧输入至声学模型,得到所述声学模型输出的音素级状态序列;所述音素级状态序列包括所述音频数据中各音频数据帧的音素级状态分类结果,所述音素级状态分类结果包括单音素状态和三音素状态; 基于所述音素级状态序列,确定是否为语音唤醒状态; 其中,所述声学模型是基于第一样本音频数据帧和所述第一样本音频数据帧对应的混合音素状态标签,对已训练模型中的分类层进行优化得到的;所述已训练模型是基于第二样本音频数据帧和所述第二样本音频数据帧对应的三音素状态标签进行训练得到的;所述混合音素状态标签包括唤醒状态对应的三音素状态,以及非唤醒状态对应的单音素状态,所述混合音素状态标签只需对应音素为唤醒状态才需要保留三音素状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。