四川职业技术学院邓林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川职业技术学院申请的专利基于大数据的机器翻译系统及文档级词汇翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120633682B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511120297.X,技术领域涉及:G06F40/58;该发明授权基于大数据的机器翻译系统及文档级词汇翻译方法是由邓林;赵萍;熊辉设计研发完成,并于2025-08-12向国家知识产权局提交的专利申请。
本基于大数据的机器翻译系统及文档级词汇翻译方法在说明书摘要公布了:本申请提供了一种基于大数据的机器翻译系统及文档级词汇翻译方法,通过提取出目标文档中词汇在翻译过程中的全局注意力;对词汇进行语义角色分析,得到词汇的语义角色特征,根据语义角色特征和词汇间的语义相似度构建词汇的词链;确定词链中各个同源单词对目标文档主题的语义贡献度,进一步对词链中的各个同源单词进行注意力交互,得到词链中各个同源单词的语义注意力;通过词链中各个同源单词的语义注意力和各个同源单词之间的词链语义关系对各个同源单词之间的上下文信息进行交互语义嵌入,得到各个同源单词的语义嵌入量,进而基于所有的语义嵌入量进行文档级词汇翻译。采用本申请的方案,可实现消解文档中词汇上下文跨句翻译产生的语义漂移。
本发明授权基于大数据的机器翻译系统及文档级词汇翻译方法在权利要求书中公布了:1.一种文档级词汇翻译方法,用于在基于大数据的机器翻译系统中进行词汇翻译,其特征在于,该方法包括如下步骤: 获取目标文档,基于全局注意力机制提取出目标文档中词汇在翻译过程中的全局注意力; 对目标文档中的词汇进行语义角色分析,得到词汇的语义角色特征,进而根据所述语义角色特征和词汇间的语义相似度构建词汇的词链; 确定所述词链中各个同源单词对目标文档主题的语义贡献度,通过所有的语义贡献度和词汇在翻译过程中的全局注意力对词链中的各个同源单词进行注意力交互,得到词链中各个同源单词的语义注意力; 通过词链中各个同源单词的语义注意力和各个同源单词之间的词链语义关系对各个同源单词之间的上下文信息进行交互语义嵌入,得到各个同源单词的语义嵌入量,进而基于所有的语义嵌入量进行文档级词汇翻译; 其中,对目标文档中的词汇进行语义角色分析,得到词汇的语义角色特征具体包括: 对目标文档中词汇所在语句进行句法依存分析,得到词汇与其所在语句中其它词汇之间的依存关系; 通过所有的依存关系标注词汇的语义角色标签; 根据所述语义角色标签确定词汇的语义角色特征; 其中,根据所述语义角色特征和词汇间的语义相似度构建词汇的词链具体包括: 根据所述语义角色特征对目标文档中所有的单词进行阈值筛选,得到候选单词集; 通过词汇间的语义相似度对所述候选单词集进行同源词筛选,得到同源单词集; 基于每个同源单词在目标文档中的索引位置,将同源单词集中所有的同源单词按索引顺序链接,得到词汇的词链; 其中,通过词链中各个同源单词的语义注意力和各个同源单词之间的词链语义关系对各个同源单词之间的上下文信息进行交互语义嵌入,得到各个同源单词的语义嵌入量具体包括: 确定词链中各个同源单词之间的词链语义关系; 通过词链中各个同源单词之间的词链语义关系对各个同源单词之间的上下文信息进行交互传递,得到各个同源单词的上下文交互表示向量; 根据词链中各个同源单词的语义注意力和各个同源单词的上下文交互表示向量对各个同源单词进行语义嵌入,得到各个同源单词的语义嵌入量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川职业技术学院,其通讯地址为:629000 四川省遂宁市船山区学府北路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励