科大讯飞股份有限公司张儒瑞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利一种语音端点检测方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114155839B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111535332.6,技术领域涉及:G10L15/02;该发明授权一种语音端点检测方法、装置、设备及存储介质是由张儒瑞;李永超设计研发完成,并于2021-12-15向国家知识产权局提交的专利申请。
本一种语音端点检测方法、装置、设备及存储介质在说明书摘要公布了:本申请提供了一种语音端点检测方法、装置、设备及存储介质,其中,语音端点检测方法该方法可判别出待检测的音频数据包含的音频帧为静音帧、噪声帧还是语音帧,即,本申请可检测出音频数据所包含音频帧的较为精准的属性,在此基础上进行语音前端点和语音后端点的检测,能够获得较为准确的检测结果。在实现语音端点检测的基础上,本申请可获取语音段的识别文本,并可根据识别文本的语义确定识别文本的语义场景,进而可根据识别文本的语义场景设置合适的后静音超时门限,从而基于合适的后静音超时门限触发后静音超时事件,以提升用户体验。
本发明授权一种语音端点检测方法、装置、设备及存储介质在权利要求书中公布了:1.一种语音端点检测方法,其特征在于,包括: 在获得待检测的音频数据后,利用预先建立的多任务联合模型,预测所述音频数据包含的音频帧分别为静音帧和非静音帧的声学得分,以及所述音频数据包含的音频帧对应的全音素声学得分;其中,一音频帧分别为静音帧和非静音帧的声学得分作为该音频帧对应的第一信息,一音频帧对应的全音素声学得分作为该音频帧对应的第二信息,所述全音素声学得分包括所述音频数据所属语种包含的所有音素分别对应的声学得分; 以所述音频数据包含的音频帧对应的第一信息和第二信息为依据,对所述音频数据包含的音频帧进行静音帧、噪声帧和语音帧的判别; 根据所述音频数据包含的音频帧对应的判别结果,检测语音前端点和语音后端点。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。