浙江科技大学刘婧玥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江科技大学申请的专利法语译文质量自动化评估方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118734865B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411207282.2,技术领域涉及:G06F40/51;该发明授权法语译文质量自动化评估方法、系统、设备及存储介质是由刘婧玥设计研发完成,并于2024-08-30向国家知识产权局提交的专利申请。
本法语译文质量自动化评估方法、系统、设备及存储介质在说明书摘要公布了:本发明公开了一种法语译文质量自动化评估方法、系统、设备及存储介质,该方法通过获取中文源语句和待评估的法语译文在BGEM3‑Emebdding模型的表征向量,并计算其距离,将其作为训练好的深度DNN网络模型的输入,得到可量化的翻译评估得分,此外,还可结合翻译评估专家的翻译评估模式和机器的自然语言理解能力,利用大语言模型的涌现能力,采用LoRA的微调方法得到微调大模型,生成合理的可解释的译文质量评估理由。本发明能够保证法语译文质量评分的准确性,有效提升翻译效率。
本发明授权法语译文质量自动化评估方法、系统、设备及存储介质在权利要求书中公布了:1.一种法语译文质量自动化评估方法,其特征在于,包括: 获取中文源语句和待评估的法语译文在BGEM3-Emebdding模型的表征向量A、B; 计算所述中文源语句的表征向量A及所述法语译文的表征向量B的距离d,作为初始的翻译评估得分; 将所述表征向量A、表征向量B以及距离d输入至训练好的深层DNN网络模型中,其中表征向量A及表征向量B作为网络第一层的输入,距离d作为所述深层DNN网络最后一层的补充输入特征;所述模型的输出即为可量化的翻译评估得分;所述深层DNN网络模型包括5层中间层,维度分别为512、256、128、64、31+1,模型的训练,其样本的构建包括: 构建中文源语句和对应法语译文的翻译样本,数据来源于联合国中法平行语料库,作为正样本;负样本包含两个部分:一是通过batch内负采样生成随机样本,二是使用google翻译的法语译文构建的困难负样本,同时对google翻译的法语译文采用dropout的方式随机丢弃10%的向量表征; 在得到可量化的翻译评估得分后,将中文源语句和待评估的法语译文和对应的可量化的翻译评估得分填充到预先设计的Prompt模版中,访问法语译文质量评估的微调大模型,得到可解释的翻译评估理由; 所述的法语译文质量评估的微调大模型是在LlaMA3模型基础上,使用高质量的SFT数据集合,采用LoRA微调的方法得到; 所述的高质量的SFT数据集合的构建方法如下: 在联合国中法平行语料库选取N条未参与所述深层DNN网络模型训练的数据,同时获取其中文源语句和对应google翻译的法语译文,得到2N个中法句子对,利用训练好的深层DNN网络模型得到所述中法句子对的可量化的翻译评估得分,并依照翻译质量评估模式,人工产出翻译质量评估理由,得到高质量的SFT数据集合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江科技大学,其通讯地址为:310000 浙江省杭州市西湖区留和路318号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励