中车长春轨道客车股份有限公司高阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中车长春轨道客车股份有限公司申请的专利语义语料的垂域嵌入模型的对比学习微调方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121457664B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610015514.7,技术领域涉及:G06N20/00;该发明授权语义语料的垂域嵌入模型的对比学习微调方法及装置是由高阳;王健;秦梓鑫;刘强设计研发完成,并于2026-01-07向国家知识产权局提交的专利申请。
本语义语料的垂域嵌入模型的对比学习微调方法及装置在说明书摘要公布了:本发明提供一种语义语料的垂域嵌入模型的对比学习微调方法及装置,这一联合优化策略产生了显著的协同效应:当处理术语密度高的专业文本切片时,较小的动态温度系数值会放大难负样本带来的细微梯度差异,迫使模型精准区分诸如"器件开口场型畸变"与"器件阻抗失配"等专业概念;同时,针对术语密度较低的一般性文本,较大的动态温度系数值能有效平衡普通负样本带来的梯度更新,防止模型在非核心内容上过度拟合,这种动态温度调节与多层次负样本策略的有机结合,确保了模型在对比学习过程中既能深度掌握专业知识,又能保持良好的泛化能力,显著提升了垂域嵌入模型在轨道交通专业场景下的语义理解精度。
本发明授权语义语料的垂域嵌入模型的对比学习微调方法及装置在权利要求书中公布了:1.一种语义语料的垂域嵌入模型的对比学习微调方法,其特征在于,具体包含步骤如下: 步骤S1:构建轨道交通专业术语库,涵盖核心设备名称、操作指令和故障类型; 步骤S2:对轨道交通行业文档进行分割和切片,形成多个文档切片; 步骤S3:计算每个文档切片中专业术语的TF-IDF权重,形成术语集合; 步骤S4:基于术语集合计算文档切片的术语密度; 步骤S5:根据术语密度调整动态温度系数; 步骤S6:构建正负例样本对,其中正样本为从专业文档数据中通过语言大模型提取的高质量问答对,负样本为从全局文档库中随机采样并经过语义特异性筛选的非相关问答对; 步骤S7:基于动态温度构建InfoNCE损失函数,进行对比学习微调; 所述的步骤S2中对轨道交通行业文档进行分割和切片,形成多个文档切片的具体步骤包括: 步骤S2.1:在完成专业术语库构建后,对输入的语料进行文本预处理,将原始技术文档、维修手册或故障报告按语义边界和最大长度的限制,切割成多个文档切片; 步骤S2.2:对每一个文档切片进行分词,将连续的文本转化为结构化的词汇序列; 所述的步骤S3中计算每个文档切片中专业术语的TF-IDF权重,形成术语集合的具体步骤包括: 步骤S3.1:对于预处理后的每个文档切片,遍历步骤S2中结构化的词汇序列中包含的所有词汇,并筛选出存在于步骤S1中专业术语库中的词汇,形成该切片所包含的专业术语集合; 步骤S3.2:针对专业术语集合中的每一个专业术语,计算专业术语在文档切片中的TF-IDF权重,该权重综合体现了术语在局部上下文和全局语料中的显著程度,TF-IDF权重的计算公式如下: 其中,是专业术语在文档切片中出现的次数,是文档切片中所有词语出现的总次数,是整个语料库中文档切片的总数,是包含专业术语的文档切片的数量; 所述的步骤S4中基于术语集合计算文档切片的术语密度具体步骤包括: 步骤S4.1:在获得所有专业术语的权重后,计算文档切片的术语密度,是文档切片的术语密度,定义为该文档切片包含的所有专业术语的TF-IDF值之和,具体公式如下: 其中是文档切片中出现的专业术语集合,这个标量值是对该文档切片专业知识浓缩程度的量化评估; 所述的步骤S5中根据术语密度调整动态温度系数具体步骤如下: 步骤S5.1:基于计算出的术语密度,调整动态温度系数,并应用于对比学习微调,将术语密度代入公式: 其中:是文档切片的动态温度系数,超参数是设定的基准温度系数,超参数是调节系数,为每个文档切片生成一个定制化的动态温度系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中车长春轨道客车股份有限公司,其通讯地址为:130062 吉林省长春市绿园区长客路2001号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励