季华实验室吴星辰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉季华实验室申请的专利一种基于错误驱动的训练数据集合成方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121434795B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512036948.3,技术领域涉及:G06F18/214;该发明授权一种基于错误驱动的训练数据集合成方法、装置及设备是由吴星辰;李友高;李荣基;李骁设计研发完成,并于2025-12-31向国家知识产权局提交的专利申请。
本一种基于错误驱动的训练数据集合成方法、装置及设备在说明书摘要公布了:本发明涉及建模数据合成技术领域,公开了一种基于错误驱动的训练数据集合成方法、装置及设备,方法包括步骤:获取问题‑标准模型种子数据对,利用目标大语言模型对问题进行自动建模,通过对比生成模型与标准模型,识别并提取模型在变量、约束、目标函数上的错误模式;基于这些错误模式,对原始问题进行语义演化,合成包含特定语义陷阱的新问题,并生成对应的标准数学模型;合成数据对需经过求解器可执行性验证和双向一致性验证,将通过验证的数据对汇集,构建出直接针对模型缺陷的高价值训练数据集。本发明实现了训练数据的自动化、针对性合成,能显著提升大语言模型在优化建模任务中的准确性、鲁棒性和训练效率,降低对人工标注的依赖。
本发明授权一种基于错误驱动的训练数据集合成方法、装置及设备在权利要求书中公布了:1.一种基于错误驱动的训练数据集合成方法,其特征在于,包括步骤: 获取包含原始自然语言问题及其对应的原始标准数学优化模型的种子数据对; 利用目标大语言模型对所述原始自然语言问题进行自动数学建模,得到生成模型; 分别对所述生成模型和所述原始标准数学优化模型进行解析,将其转换为结构化的中间表示,所述中间表示至少包括:决策变量集合、目标函数表达式、约束条件集合;基于所述中间表示,对所述生成模型和所述原始标准数学优化模型在变量、约束、目标三个维度上进行逐项比对,计算差异特征;根据预设的错误分类规则,将所述差异特征映射到具体的结构性错误模式,并记录触发所述结构性错误模式的原始自然语言问题中的诱因文本片段,所述结构性错误模式、原始自然语言问题以及诱因文本片段构成错误模式库; 从所述错误模式库中选取一个或多个结构性错误模式,并获取其对应的诱因文本片段及原始自然语言问题;根据所选结构性错误模式的类型和复杂程度,从预设的语义演化策略库中选择一种或多种语义演化算子;将所述诱因文本片段和所述原始自然语言问题的完整描述作为输入,应用选择的语义演化算子,生成一个或多个候选的新自然语言问题;对所述新自然语言问题进行分析并判断其相较于原始自然语言问题在数学结构上是否发生实质性变化;若新自然语言问题在数学结构上未发生实质性变化,则直接复制或微调整所述标准数学优化模型,作为更新标准数学优化模型;若新自然语言问题在数学结构上发生实质性变化,则根据演化后的语义,通过预设规则或辅助大语言模型,推导更新标准数学优化模型;将所述新自然语言问题与对应更新标准数学优化模型形成新合成数据对; 对所述新合成数据对中的更新标准数学优化模型进行求解器可执行性验证,并采用双向一致性验证机制,验证从所述新自然语言问题到更新标准数学优化模型、再从更新标准数学优化模型回解的逻辑一致性; 将通过可执行性验证和双向一致性验证机制的新合成数据对进行汇集,构建用于训练目标大语言模型的训练数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人季华实验室,其通讯地址为:528200 广东省佛山市南海区桂城街道环岛南路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励