科大讯飞股份有限公司佟欣欣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利训练样本的获取方法和装置、计算机设备、存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114495940B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111630256.7,技术领域涉及:G10L15/26;该发明授权训练样本的获取方法和装置、计算机设备、存储介质是由佟欣欣;许丽设计研发完成,并于2021-12-28向国家知识产权局提交的专利申请。
本训练样本的获取方法和装置、计算机设备、存储介质在说明书摘要公布了:本申请提供了一种训练样本的获取方法和装置、计算机设备、存储介质,解决了现有技术中训练样本的获取过程人工成本高和周期长的问题。其中,获取方法包括:基于n元语法模型确定用户确认文本中的第一文本句子,n元语法模型是基于预设文本训练得到的,n元语法模型包括多个n元数据单元,第一文本句子包括至少一个n元数据单元;基于第一文本句子确定目标文本句子;对目标文本句子对应的语音片段进行语音识别,得到识别文本;当识别文本和目标文本句子的匹配度满足第一预设条件时,确定标注有识别文本的语音片段为训练样本。
本发明授权训练样本的获取方法和装置、计算机设备、存储介质在权利要求书中公布了:1.一种训练样本的获取方法,其特征在于,包括: 基于n元语法模型确定用户确认文本中的第一文本句子,所述n元语法模型是基于预设文本训练得到的,所述n元语法模型包括多个n元数据单元,所述第一文本句子包括至少一个所述n元数据单元; 基于所述第一文本句子确定目标文本句子; 对所述目标文本句子对应的语音片段进行语音识别,得到识别文本; 当所述识别文本和所述目标文本句子的匹配度满足第一预设条件时,确定标注有所述识别文本的所述语音片段为所述训练样本; 其中,所述n元数据单元包括n个连续三音素单元;所述用户确认文本包括至少一个文本句子;所述基于n元语法模型确定用户确认文本中的第一文本句子包括:确定所述至少一个文本句子各自的三音素句子;确定所述三音素句子中包括至少一个所述n元数据单元的第一三音素句子;确定所述第一三音素句子对应的所述文本句子为所述第一文本句子; 其中,所述确定所述三音素句子中包括至少一个所述n元数据单元的第一三音素句子包括:将所述多个n元数据单元分别与所述三音素句子进行滑动匹配;当匹配结果一致时,确定当前的所述三音素句子为所述第一三音素句子。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。