哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)张梅山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种基于语音端到端的依存结构分析方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119296528B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411344318.1,技术领域涉及:G10L15/18;该发明授权一种基于语音端到端的依存结构分析方法及装置是由张梅山;李欣欣;喻曦;张民设计研发完成,并于2024-09-25向国家知识产权局提交的专利申请。
本一种基于语音端到端的依存结构分析方法及装置在说明书摘要公布了:本发明涉及自然语言处理技术领域,特别是指一种基于语音端到端的依存结构分析方法及装置。方法包括:对语音数据进基于语音特征提取器获取特征向量,将特征向量输入到语音解码器中得到语音嵌入向量表示;基于适配器将语音嵌入向量表示映射到文本空间;将映射后的数据通过双仿射解码器输出语音的依存结构分析结果;将转录文本进行标签对齐获得转录文本的对齐标签;通过对齐标签端到端的训练语音依存结构分析模型。本发明直接从语音入手,实现对语音特征的利用,使用对齐工具映射金标文本的标签信息到转录文本上,充分利用依存结构分析的数据训练语音依存结构分析模型。
本发明授权一种基于语音端到端的依存结构分析方法及装置在权利要求书中公布了:1.一种基于语音端到端的依存结构分析方法,其特征在于,所述方法包括: S1、获取语音数据,通过语音特征提取器获取语音特征向量,所述语音特征向量输入到语音解码器中,获得语音嵌入向量表示; S2、基于适配器将语音嵌入向量表示映射到文本空间,获得文本嵌入向量表示; 其中,所述S2中的基于适配器将语音嵌入向量表示映射到文本空间,获得文本嵌入向量表示,包括: 预设适配器;所述适配器通过构建语音解码器词汇表到双仿射解码器词汇表的映射矩阵来实现; 将语音嵌入向量表示为对应的独热向量,将独热向量通过矩阵乘法与映射矩阵相乘,得到文本嵌入向量表示; 通过所述适配器将语音嵌入向量表示映射到文本空间,获得所述语音嵌入向量表示对应的文本嵌入向量表示; S3、对映射后的文本嵌入向量表示进行解码获得转录文本,将所述转录文本进行标签对齐,获得所述转录文本的对齐标签; S4、将文本嵌入向量表示通过双仿射解码器输出语音的依存结构分析结果;通过语音的依存结构分析结果与所述对齐标签端到端训练语音依存结构分析模型,基于训练后的所述语音依存结构分析模型完成语音的依存结构分析。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励