科大讯飞股份有限公司杨琴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利发音检错方法及装置、语音评分方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114495986B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111678431.X,技术领域涉及:G10L25/60;该发明授权发音检错方法及装置、语音评分方法及装置是由杨琴;吴奎;盛志超;金海;李芳足;张志勇设计研发完成,并于2021-12-31向国家知识产权局提交的专利申请。
本发音检错方法及装置、语音评分方法及装置在说明书摘要公布了:本公开披露了一种发音检错方法及装置、语音评分方法及装置,涉及音频处理技术领域。该发音检错方法包括:确定待检错朗读语音的状态序列;确定待检错朗读语音对应的朗读文本包含的音素各自对应的N音素时间边界信息;基于状态序列和朗读文本包含的音素各自对应的N音素时间边界信息,生成音素聚合数据;基于音素聚合数据,确定朗读文本包含的音素各自对应的检错信息。由于音素聚合数据是基于朗读文本包含的音素各自对应的N音素时间边界信息对状态序列进行多尺度聚合操作后生成的,因此,音素聚合数据能够包含不同尺度的音素局部信息和音素全局信息。由此可见,本公开能够借助音素聚合数据提高检错精准度和检错稳定性。
本发明授权发音检错方法及装置、语音评分方法及装置在权利要求书中公布了:1.一种发音检错方法,其特征在于,包括: 确定待检错朗读语音的状态序列; 确定所述待检错朗读语音对应的朗读文本包含的音素各自对应的N音素时间边界信息,其中,N为正整数; 基于所述朗读文本包含的音素各自对应的N音素时间边界信息对所述状态序列进行不同时间尺度的聚合操作,生成音素聚合数据; 基于所述音素聚合数据,确定所述朗读文本包含的音素各自对应的检错信息; 其中,所述不同时间尺度的聚合操作包括短时聚合操作,所述音素聚合数据包括短时聚合数据;所述基于所述朗读文本包含的音素各自对应的N音素时间边界信息对所述状态序列进行不同时间尺度的聚合操作,生成音素聚合数据,包括: 基于所述朗读文本包含的音素各自对应的N音素时间边界信息,划分所述状态序列,得到所述朗读文本包含的音素各自对应的状态序列段; 基于所述朗读文本包含的音素各自对应的状态序列段,进行至少一次所述短时聚合操作,得到至少一次所述短时聚合操作各自对应的聚合数据; 融合至少一次所述短时聚合操作各自对应的聚合数据,得到所述短时聚合数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励