思必驰科技股份有限公司薛少飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉思必驰科技股份有限公司申请的专利语音识别系统的优化方法、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115620725B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211124936.6,技术领域涉及:G10L15/26;该发明授权语音识别系统的优化方法、电子设备和存储介质是由薛少飞;雷金博;唐健;吴旭貌设计研发完成,并于2022-09-15向国家知识产权局提交的专利申请。
本语音识别系统的优化方法、电子设备和存储介质在说明书摘要公布了:本发明公开一种语音识别系统的优化方法、电子设备和存储介质。在该方法中,获取初始数据集,初始数据集包含多条音频数据和相应的匹配识别文本;根据初始数据集确定第一数据子集和第二数据子集;其中,第一数据子集的识别可信级别大于第二数据子集的识别可信级别;基于第一数据子集和第二数据子集,对语音识别系统进行混合监督训练,其中第一数据子集用于语音识别系统进行有监督训练,以及第二数据子集用于语音识别系统进行无监督训练。由此,使用高识别可信级别的数据子集来进行有监督训练,并使用低识别可信级别的数据子集来进行无监督训练,充分挖掘数据集的学习价值,能够有效提升语音识别系统的优化效果。
本发明授权语音识别系统的优化方法、电子设备和存储介质在权利要求书中公布了:1.一种语音识别系统的优化方法,包括: 获取初始数据集,所述初始数据集包含多条音频数据和相应的匹配识别文本; 根据初始数据集确定第一数据子集和第二数据子集,包括:识别并滤除所述初始数据集中的无效数据;获取经筛除的初始数据集中各个数据所对应的识别可信级别,并基于识别可信级别确定所述第一数据子集和所述第二数据子集;其中,所述第一数据子集的识别可信级别大于所述第二数据子集的识别可信级别; 针对经筛除的初始数据集中的各个音频数据,获取所述音频数据相对于匹配识别文本的识别置信度,并将所述识别置信度与不同识别可信级别所分别对应的识别置信度区间[a1]、[a2]和[a3]进行比较,其中[a1]<[a2]<[a3];根据与所述识别置信度区间[a2]对应的音频数据确定第二数据子集;为与所述识别置信度区间[a1]对应的音频数据配置相应的标注文本,以得到相应的标注音频数据;基于所述标注音频数据和与所述识别置信度区间[a3]对应的音频数据确定第一数据子集; 基于所述第一数据子集和所述第二数据子集,对所述语音识别系统进行混合监督训练,其中所述第一数据子集用于所述语音识别系统进行有监督训练,以及所述第二数据子集用于所述语音识别系统进行无监督训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人思必驰科技股份有限公司,其通讯地址为:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。