Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州网之易创新科技有限公司王树栋获国家专利权

杭州网之易创新科技有限公司王树栋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州网之易创新科技有限公司申请的专利语音音素识别方法、介质、装置和计算设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116453504B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310183937.6,技术领域涉及:G10L15/02;该发明授权语音音素识别方法、介质、装置和计算设备是由王树栋;许盛辉;潘照明设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。

语音音素识别方法、介质、装置和计算设备在说明书摘要公布了:本公开的实施方式提供了一种语音音素识别方法、介质、装置和计算设备。该方法包括:将待识别的语音数据输入到预先训练的音素识别模型中,输出语音数据对应的音素序列,音素序列包括语音数据中每个音素的出现顺序。本公开解决了相关技术中语音识别无法有效匹配虚拟人物形象的唇部动作和语音的问题,将语音数据拆解为可以由AI的唇部动作对应表现的音素的集合,且以序列形式表现,使得AI通过读取音素序列,可以按每个音素的持续时间依次通过唇部动作进行表现,从而实现唇部动作与语音的准确匹配,进而显著提高观众的体验。

本发明授权语音音素识别方法、介质、装置和计算设备在权利要求书中公布了:1.一种语音音素识别方法,其特征在于,所述方法包括: 将待识别的语音数据输入到预先训练的音素识别模型中,输出所述语音数据对应的音素序列,所述音素序列包括所述语音数据中每个音素的出现顺序; 所述音素识别模型通过如下方式训练得到: 确定用于训练的样本语音数据对应的样本汉字序列; 在每个相邻的样本文字间插入一个样本间隔字符; 将所述样本汉字转化为样本拼音; 将样本拼音按照拼音与音素的关系拆分,拆分后的音素之间用空格符号加以区分; 将包含所述样本拼音和所述样本间隔字符的序列转化为样本音素序列; 将所述样本语音数据输入到所述音素识别模型中,输出预测音素序列; 基于所述输出的预测音素序列与所述样本音素序列,确定所述预测音素序列的正确性; 基于所述预测音素序列的正确性,计算所述音素识别模型的损失函数; 基于损失函数的结果,对所述音素识别模型进行训练; 其中,所述音素识别模型包括依次连接的卷积神经网络、双向长短记忆网络和基于神经网络的时序类分类器,所述将所述样本语音数据输入到所述音素识别模型中,输出所述预测音素序列,包括: 将所述样本语音数据转化为语谱图数据,并输入到所述卷积神经网络中,输出所述样本语音数据对应的语音特征数据; 将所述语音特征数据输入到双向长短记忆网络中,输入所述样本语音数据对应的时序特征数据; 将所述时序特征数据输入到基于神经网络的时序类分类器中,基于神经网络的时序类分类器将时序特征数据对应到具体的时间点,通过生成不同数量的间隔字符,使得到的每个音素与样本语音数据对应声音出现的时间点相对齐,得到并输出的包含间隔字符的预测音素序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州网之易创新科技有限公司,其通讯地址为:310056 浙江省杭州市滨江区长河街道网商路399号3幢305室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。