国网湖南省电力有限公司信息通信分公司;国网湖南省电力有限公司;国家电网有限公司方彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网湖南省电力有限公司信息通信分公司;国网湖南省电力有限公司;国家电网有限公司申请的专利开发脚本的数据血缘提取补全方法及系统、设备、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121234341B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511806007.7,技术领域涉及:G06F21/16;该发明授权开发脚本的数据血缘提取补全方法及系统、设备、介质是由方彬;祝视;余琦;李轶佳;薛静远;曹杰;徐宁;向柯宇;廖铭鼎;张经宇设计研发完成,并于2025-12-03向国家知识产权局提交的专利申请。
本开发脚本的数据血缘提取补全方法及系统、设备、介质在说明书摘要公布了:本发明公开了一种开发脚本的数据血缘提取补全方法及系统、设备、介质,该方法基于自然语言模型生成开发脚本的数据血缘链路图,同时还生成了血缘链路的自然语言描述,不仅实现了对开发脚本业务意图的准确识别与解析,并且细致提取了字段级血缘关系。另外,借助大语言模型强大的语义推力和关联能力,可以智能地补全那些未在代码中明确书写但实际存在的隐式字段级依赖,显著提升了对隐性依赖关系的识别率和补全准确性,确保了全链路血缘的连贯性与可信度。并且,还基于多轮验证剔除掉低共识度血缘链路,实现了对血缘链路的稳定收敛与可信筛选,大大提高了最终数据血缘关系的稳定性、鲁棒性和审计可追溯性。
本发明授权开发脚本的数据血缘提取补全方法及系统、设备、介质在权利要求书中公布了:1.一种开发脚本的数据血缘提取补全方法,其特征在于,包括以下内容: 利用自然语言模型生成开发脚本的数据血缘链路图,并生成血缘链路的自然语言描述; 基于生成式语言模型对数据血缘链路图中的缺失链路进行补全,得到补全后的数据血缘链路图; 基于补全后的数据血缘链路图进行多轮验证,并基于多轮验证结果剔除掉低共识度血缘链路,得到最终的数据血缘链路图; 所述利用自然语言模型生成开发脚本的数据血缘链路图,并生成血缘链路的自然语言描述的过程包括以下内容: 对开发脚本进行分层解析,生成标准化的结构化数据; 利用自然语言模型结合提示词工程机制,将结构化数据转化为三元组形式的血缘关系集合; 识别开发脚本运行时的隐性依赖,利用自然语言模型将隐性依赖转化为三元组并融入到血缘关系集合中; 基于血缘关系集合生成数据血缘链路图,并利用自然语言模型生成每条血缘链路的自然语言描述; 所述基于生成式语言模型对数据血缘链路图中的缺失链路进行补全的过程包括以下内容: 基于多源异构的结构化知识构建面向数据血缘的专家知识库,并在专家知识库中采用超图神经网络对血缘耦合关系进行建模; 基于多智能体对专家知识库进行动态演化维护; 基于多模态语言编码在专家知识库中进行血缘知识锚定,并在锚定环节通过构造正负样本提升模型的语义区分上的敏感性; 基于锚定的结构化知识,采用检索增强生成架构补全缺失链路; 所述基于补全后的数据血缘链路图进行多轮验证,并基于多轮验证结果剔除掉低共识度血缘链路的过程包括以下内容: 基于补全后的数据血缘链路图进行多轮采样,得到若干组血缘链路候选结果; 对若干组血缘链路候选结果进行过滤和标准化处理; 基于标准化处理后的若干组血缘链路候选结果进行一致性层面的统计筛选,评估每条血缘链路的共识得分,将共识得分低于预设阈值的血缘链路标记为低共识度血缘链路并将其剔除; 评估剩余血缘链路的置信度,将高置信度的血缘链路标记为可信血缘并将其纳入最终的数据血缘链路图; 基于下式评估每条血缘链路的共识得分: ; 其中,表示第条候选血缘链路的共识得分,表示第条候选血缘链路在多轮采样中的出现频率,表示多轮采样生成的候选血缘链路总数,表示冲突惩罚系数,表示第条候选血缘链路的冲突比率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网湖南省电力有限公司信息通信分公司;国网湖南省电力有限公司;国家电网有限公司,其通讯地址为:410000 湖南省长沙市天心区新韶东398号6-8楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励