Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳市友杰智新科技有限公司杨浪珺获国家专利权

深圳市友杰智新科技有限公司杨浪珺获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳市友杰智新科技有限公司申请的专利数字的语音识别方法、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121214937B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511748679.7,技术领域涉及:G10L15/22;该发明授权数字的语音识别方法、设备和介质是由杨浪珺设计研发完成,并于2025-11-26向国家知识产权局提交的专利申请。

数字的语音识别方法、设备和介质在说明书摘要公布了:本发明属于语音识别技术领域,公开一种数字的语音识别方法、设备和介质,应用于端侧离线语音识别模组及带语音交互功能的家电、消费电子设备。其中方法包括:获取待识别语音;通过语音识别模型解码待识别语音,得到初步识别结果;回看NN为大于1的正整数帧音素概率输出数据,确定是否存在预设数字混淆类型;若存在,基于对应混淆类型的纠错策略对初步结果纠错,得到最终结果;若不存在,直接输出初步结果。本发明通过“模型解码+回帧判断+针对性纠错”的流程,精准解决数字语音识别中的路径包含混识别、同位竞争混识别等问题,在保证识别实时性的同时,显著提升数字识别准确率,实现成本低、灵活性高,适配端侧设备的场景需求。

本发明授权数字的语音识别方法、设备和介质在权利要求书中公布了:1.一种数字的语音识别方法,其特征在于,所述方法包括: 获取待识别语音; 通过语音识别模型对所述待识别语音进行解码,得到初步识别结果; 回看N帧的音素概率输出数据,确定是否存在预设的数字混淆类型,其中,N为大于1的正整数; 若存在,则基于对应所述数字混淆类型的纠错策略,对所述初步识别结果进行纠错,得到最终的识别结果; 若不存在,则将所述初步识别结果作为最终的识别结果; 所述回看N帧的音素概率输出数据,确定是否存在预设的数字混淆类型,包括: 若在回看N帧的音素概率输出数据中,检索到存在易混词条的目标音素且该目标音素得分符合设定阈值,则确定存在路径包含混识别类型,所述易混词条指与目标词条存在音素路径包含关系的词条,所述目标音素指易混词条区别于目标词条的音素;或者, 若在回看N帧的音素概率输出数据中,易混词条的同位关键音素均有概率输出且需通过得分对比判定结果,则确定存在路径同位竞争混识别类型,所述需通过得分对比判定结果,指两种同位关键音素的得分均未低于基础阈值,无法直接通过单一得分判定哪个词条更准确,需进一步对比得分;或者, 若在回看N帧的音素概率输出数据中,检测到存在非目标音素且该非目标音素得分超过异常阈值,则确定存在路径包含误识别类型,所述非目标音素指不属于目标命令词音素集合的音素;或者, 若在回看N帧的音素概率输出数据中对应的识别区间内,计算得到前后时间间隔大于时间长度阈值,且统计到得分超过设定值的非目标音素数量满足预设策略,则确定存在集外词误识别类型,所述识别区间指初步识别结果对应的语音信号时间区间,所述前后时间间隔指相邻音素的时间间隔。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市友杰智新科技有限公司,其通讯地址为:518000 广东省深圳市南山区招商街道沿山社区沿山路22号火炬大厦701;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。