Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京智谱华章科技有限公司王路路获国家专利权

北京智谱华章科技有限公司王路路获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京智谱华章科技有限公司申请的专利中文句子简化模型的训练方法、中文句子精简方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114757204B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210459421.5,技术领域涉及:G06F40/30;该发明授权中文句子简化模型的训练方法、中文句子精简方法及装置是由王路路;张鹏;杜冀中;闫磊;陆弘锴;刘佳;李光军;崔菲;彭钰婷设计研发完成,并于2022-04-27向国家知识产权局提交的专利申请。

中文句子简化模型的训练方法、中文句子精简方法及装置在说明书摘要公布了:本申请提出一种中文句子简化模型的训练方法、中文句子精简方法及装置,中文句子简化模型的训练方法包括:获取包含监督信号的复杂句‑简单句句对的数据集和中文单语种预训练模型;在每个训练批次中选择当前复杂句‑简单句句对中的简单句为正样例,在同一训练批次的其他句对中随机选择预设数量个简单句为负样例;将复杂句、正样例和负样例投影到向量表示空间中,分别获取在编码器最后一层的隐藏层向量;计算对比学习损失,并通过解码器计算生成期望的简单句的交叉熵损失;通过最小化中文单语种预训练模型输出的简单句的对比学习损失和交叉熵损失来联合训练中文单语种预训练模型。该方法得到的简化模型可以提高生成的简化句子的可控性和忠实度。

本发明授权中文句子简化模型的训练方法、中文句子精简方法及装置在权利要求书中公布了:1.一种中文句子简化模型的训练方法,其特征在于,包括以下步骤: 获取预设的包含监督信号的复杂句-简单句句对的数据集作为训练数据,并获取基于编码器-解码器结构的中文单语种预训练模型;所述复杂句-简单句句对是由一个复杂句与一个语义相似但长度短的简单句组成的句对,所述监督信号是句对中的复杂句与简单句之间的比值信息,所述监督信号包括句子长度比、编辑距离比、词汇复杂度比和句法树深度比; 基于对比学习的方式,在每个训练批次中选择当前复杂句-简单句句对中的简单句为正样例,在同一训练批次的其他句对中随机选择预设数量个简单句为负样例; 将所述当前复杂句-简单句句对中的复杂句、所述正样例和所述负样例投影到向量表示空间中,分别获取所述复杂句、所述正样例和所述负样例在编码器最后一层的隐藏层向量; 基于所述隐藏层向量,计算对比学习损失,并通过解码器计算生成期望的简单句的交叉熵损失; 通过最小化所述中文单语种预训练模型输出的简单句的所述对比学习损失和所述交叉熵损失来联合训练所述中文单语种预训练模型,以对所述预训练模型进行微调获得中文句子简化模型; 所述获取基于编码器-解码器结构的中文单语种预训练模型,包括: 选取中文语句中常用的标点符号、数字、英文字母和高频的中文词,作为新的词汇表; 将预设的基于编码器-解码器结构的多语种预训练模型的原始词汇表替换为所述新的词汇表,并更新所述多语种预训练模型的输入向量和输出向量的表示参数,以更新所述多语种预训练模型; 保存所述新的词汇表和更新后的预训练模型,以将所述多语种预训练模型剪枝为所述中文单语种预训练模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智谱华章科技有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院6号楼6层603A;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。