西南石油大学;成都盛特石油装备模拟技术股份有限公司李平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西南石油大学;成都盛特石油装备模拟技术股份有限公司申请的专利一种面向钻井模拟器的智能助教系统基座LLM训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121414554B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511972071.2,技术领域涉及:G06Q50/20;该发明授权一种面向钻井模拟器的智能助教系统基座LLM训练方法是由李平;曹爽;王换文;钟原;张静;龚捷;丁鹏;贾月乐;曹宇设计研发完成,并于2025-12-25向国家知识产权局提交的专利申请。
本一种面向钻井模拟器的智能助教系统基座LLM训练方法在说明书摘要公布了:本发明提供了一种面向钻井模拟器的智能助教系统基座LLM训练方法,属于石油钻井大语言模型训练技术领域,该方法包括:基于智能助教系统基座大语言模型,获取钻井模拟器仿真数据,并进行领域自适应预训练;利用低秩自适应,对原始权重进行微调,并进行操作步骤以及故障诊断生成;通过构建企业私有知识库,利用检索增强生成对大语言模型进行训练,并通过显式监督,得到经训练的验证头;定义直接偏好优化损失函数,并结合验证头,得到检索感知的直接偏好优化损失函数,对大语言模型进行优化,完成大语言模型训练;本发明能够融合外部专业知识库、理解设备运行机理并具备教学引导与错误诊断能力的智能助手架构,提升了钻井模拟器的智能化水平。
本发明授权一种面向钻井模拟器的智能助教系统基座LLM训练方法在权利要求书中公布了:1.一种面向钻井模拟器的智能助教系统基座LLM训练方法,其特征在于,包括以下步骤: S1、基于智能助教系统基座大语言模型,获取钻井模拟器仿真数据,并对大语言模型进行领域自适应预训练,得到经物理奠基的大语言模型; S2、获取训练数据,利用低秩自适应,对原始权重进行微调,并对经物理奠基的大语言模型进行操作步骤以及故障诊断生成,得到经领域语义适配的大语言模型; S3、构建企业私有知识库,并利用检索增强生成对经领域语义适配的大语言模型进行训练,得到经检索增强对齐的大语言模型,并通过显式监督,训练得到经训练的验证头,具体为: S301、将便携式文档格式或标准操作规程解析为文本,并利用双向编码器表征法生成嵌入,通过存入向量数据库,构建企业私有知识库; S302、根据企业私有知识库,利用预设采样方法,获取文档片段,得到检索段落集,并将问题与文档片段进行拼接,得到金标准答案; S303、对问题、检索段落集以及金标准答案进行组合,得到标注的三元组; S303、根据标注的三元组,利用检索增强生成,通过获取多文档检索增强生成损失,对经领域语义适配的大语言模型进行训练,得到经检索增强对齐的大语言模型; S304、根据金标准答案以及检索段落集的平均嵌入,通过对生成内容是否被检索支持进行显式监督,通过计算检索对齐损失,训练得到经训练的验证头; 所述多文档检索增强生成损失的表达式如下所示: 其中,表示多文档检索增强生成损失,表示概率,表示金标准答案,表示问题,表示检索段落集,表示模型参数; 所述检索对齐损失的表达式如下所示: 其中,表示检索对齐损失,表示二元交叉熵损失,表示认为生成答案被检索证据支持的概率,表示指示函数,表示验证头的权重向量,表示金标准答案的表示,表示检索段落集的平均嵌入; S4、获取错误与解决数据,根据经检索增强对齐的大语言模型,对标准直接偏好优化损失函数进行定义,并结合经训练的验证头,得到检索感知的直接偏好优化损失函数,对大语言模型进行优化,得到经偏好优化的大语言模型,完成大语言模型训练,具体为: S401、基于钻井培训的教学需求,利用钻井模拟器中积累的真实错误场景与工程师撰写的高质量解决方案,获取错误与解决数据; S402、根据经检索增强对齐的大语言模型,结合人工标注的偏好对,对标准直接偏好优化损失函数进行定义; S403、根据经训练的验证头,获取支持度得分,并根据预设支持度阈值,定义得到证据对齐正则项; S404、利用证据对齐正则项,对标准直接偏好优化损失函数引入检索增强生成对齐机制,得到直接偏好优化损失函数; S405、将经训练的验证头作为直接偏好优化损失函数的动态权重,得到检索感知的直接偏好优化损失函数; S406、利用检索感知的直接偏好优化损失函数,对大语言模型进行优化,得到经偏好优化的大语言模型; S407、利用经偏好优化的大语言模型,获取模型输出,对模型输出按预设维度进行评分,将大于或等于预设评分值的模型输出中样本对添加至直接偏好优化训练集; S408、利用直接偏好优化训练集,通过每月对检索感知的直接偏好优化损失函数进行重训练,建立得到月度评估与数据迭代机制,形成部署、收集、评估以及优化的持续进化闭环,完成大语言模型训练; 所述错误与解决数据包含:输入、偏好回答以及拒绝回答; 所述输入具体为结构化错误场景,包含:背景、参数变化、错误动作以及报警信息; 所述偏好回答具体为工程师撰写的高质量解决方案,包含:错误原因解析、正确处理步骤、每步的原理解释、相关风险点与安全阈值以及常见误区提醒;并标注引用的企业文档; 所述拒绝回答,具体为用户原始错误回答或浅层解释; 所述人工标注的偏好对包含偏好回答和拒绝回答; 所述检索感知的直接偏好优化损失函数的表达式如下所示: 其中,表示检索感知的直接偏好优化损失函数,表示输入和偏好回答的验证头得分,表示正则系数,表示标准直接偏好优化损失,表示偏好数据集中三元组的期望,表示偏好数据集,表示输入,表示偏好回答,表示拒绝回答,表示温度系数,表示sigmoid函数,表示当前训练模型,表示经检索增强对齐的大语言模型,表示输入和偏好回答的支持度得分; 所述证据对齐正则项的表达式如下所示: 其中,表示证据对齐正则项,表示输入和偏好回答的支持度得分,表示梯度惩罚系数,表示预设支持度阈值,表示对偏好回答的对数概率梯度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南石油大学;成都盛特石油装备模拟技术股份有限公司,其通讯地址为:610500 四川省成都市新都区新都大道8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励