Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科凡语科技有限公司刘宇宸获国家专利权

北京中科凡语科技有限公司刘宇宸获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科凡语科技有限公司申请的专利基于特征迁移损失的语音翻译装置的训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114139557B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111339635.0,技术领域涉及:G06F40/58;该发明授权基于特征迁移损失的语音翻译装置的训练方法是由刘宇宸;周玉设计研发完成,并于2021-11-12向国家知识产权局提交的专利申请。

基于特征迁移损失的语音翻译装置的训练方法在说明书摘要公布了:本公开提供了一种基于特征迁移损失的语音翻译装置的训练方法,包括:对语音翻译装置的语音识别模块进行语音序列与文本序列之间的对齐训练;对语音翻译装置的语义编码器和解码器进行文本翻译训练;对对齐训练之后的语音识别模块、文本翻译训练后的语义编码器以及文本翻译训练之后的解码器进行语音翻译训练;基于文本翻译训练中的语义编码器生成的源语言文本序列的包含语义信息的表示及语音翻译训练中的语义编码器生成的源语言语音特征序列的包含语义信息的表示,构建特征迁移损失函数;基于特征迁移损失函数,最小化特征迁移损失,以获得语音翻译装置。本公开还提供了一种语音翻译装置、电子设备以及可读存储介质。

本发明授权基于特征迁移损失的语音翻译装置的训练方法在权利要求书中公布了:1.一种基于特征迁移损失的语音翻译装置的训练方法,其特征在于,包括: S102、基于包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对语音翻译装置的语音识别模块进行语音序列与文本序列之间的对齐训练,获得对齐训练之后的语音识别模块; S104、基于所述包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对语音翻译装置的语义编码器和解码器进行文本翻译训练,以获得文本翻译训练之后的语义编码器和解码器; S106、基于所述包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对所述对齐训练之后的语音识别模块、所述文本翻译训练后的语义编码器以及文本翻译训练之后的解码器进行语音翻译训练,以获得语音翻译训练之后的语音识别模块、语义解码器以及解码器; S108、基于所述文本翻译训练中的所述语义编码器生成的源语言文本序列的包含语义信息的表示及所述语音翻译训练中的所述语义编码器生成的源语言语音特征序列的包含语义信息的表示,构建特征迁移损失函数;以及 S110、基于所述特征迁移损失函数,最小化特征迁移损失,以获得所述语音翻译装置。 S102中,基于包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对语音翻译装置的语音识别模块进行语音特征序列与文本序列之间的对齐训练,包括: 所述语音识别模块基于所述数据集中的源语言语音特征序列生成多个源语言文本预测序列,基于所述多个源语言文本预测序列以及所述数据集中的相应的源语言文本序列进行所述对齐训练; 所述语音识别模块包括多头注意力网络、前馈神经网络以及softmax函数模块,所述源语言语音特征序列作为所述多头注意力网络的输入,所述多头注意力网络的输出作为所述前馈神经网络的输入,所述前馈神经网络的输出作为所述softmax函数模块的输入,所述softmax函数模块输出所述多个源语言文本预测序列; 所述语音识别模块还包括CTC损失函数模块,所述CTC损失函数模块基于各个所述源语言文本预测序列的预测概率之和构建CTC损失函数,最小化CTC损失以结束所述对齐训练; S104、基于包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对语音翻译装置的语义编码器和解码器进行文本翻译训练,以获得文本翻译训练之后的语义编码器和解码器,包括: 构建文本翻译任务的目标函数,最小化所述文本翻译任务的目标函数的最大似然损失,以结束对语义编码器和解码器的文本翻译训练;其中,文本翻译任务的目标函数表达 为:其中,x表示源语言文本序列,y表示目标语言文本序列,DST表示数据集。 S106中,基于所述包括源语言语音特征序列-源语言文本序列-目标语言文本序列的数据集对所述对齐训练之后的语音识别模块、所述文本翻译训练后的语义编码器以及文本翻译训练之后的解码器进行语音翻译训练,包括: 构建语音翻译任务的目标函数,最小化所述语音翻译任务的目标函数的最大似然损失,以结束对语音识别模块、语义编码器及解码器的语音翻译训练;其中,语音翻译任务的目标函数表达为: 其中,s表示源语言语音特征序列,y表示目标语言文本序列,DST表示数据集。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科凡语科技有限公司,其通讯地址为:100190 北京市海淀区知春路63号51号楼10层1006;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。