成都市大数据中心(成都市12345热线服务中心)康岩龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都市大数据中心(成都市12345热线服务中心)申请的专利基于大语言模型的政务数据质量检核规则生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120012756B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510086114.0,技术领域涉及:G06F40/205;该发明授权基于大语言模型的政务数据质量检核规则生成方法及系统是由康岩龙;曾轲;吕建洲;尹旭;相里亚捷;张林军设计研发完成,并于2025-01-20向国家知识产权局提交的专利申请。
本基于大语言模型的政务数据质量检核规则生成方法及系统在说明书摘要公布了:本发明涉及一种基于大语言模型的政务数据质量检核规则生成方法及系统,属于数据质量检核技术领域,解决了现有数据质量检核规则需要技术人员参与,无法自动快速地生成和自适应调整的问题。方法包括:获取待检核的目标表及其中各目标字段的元数据信息;依次取出每个目标字段,根据目标表和目标字段的元数据信息获取字段语义向量、联合语义向量、字段结构向量和或枚举值向量,进而从政务知识图谱中检索相似度最大的历史字段的知识片段;当知识片段不为空时,根据目标表和目标字段的元数据信息以及知识片段构建动态提示词,传入大语言模型中生成目标字段的数据质量检核规则。实现了自动化快速生成数据质量检核规则。
本发明授权基于大语言模型的政务数据质量检核规则生成方法及系统在权利要求书中公布了:1.一种基于大语言模型的政务数据质量检核规则生成方法,其特征在于,包括以下步骤: 获取待检核的目标表及其中各目标字段的元数据信息; 依次取出每个目标字段,根据目标表和目标字段的元数据信息获取字段语义向量、联合语义向量、字段结构向量和或枚举值向量,进而从政务知识图谱中检索相似度最大的历史字段的知识片段;所述知识片段包括:历史字段的元数据信息、历史字段关联的数据质量检核规则、数据标准和数据质量检核模板; 当知识片段不为空时,根据目标表和目标字段的元数据信息以及知识片段构建动态提示词,传入大语言模型中生成目标字段的数据质量检核规则; 所述字段语义向量是利用嵌入模型获取目标字段注释的嵌入向量而得到;所述联合语义向量是利用嵌入模型获取目标表注释和目标字段注释拼接后的嵌入向量而得到;所述字段结构向量是利用嵌入模型获取目标字段多个元数据拼接后的嵌入向量而得到;所述枚举值向量是如果目标字段是枚举类型时,利用嵌入模型获取枚举值列表的嵌入向量而得到; 所述政务知识图谱中各历史字段具有多个索引,其中第一索引是根据历史字段的联合语义向量、字段结构向量和或枚举值向量,以及各自的权重而计算的加权融合向量,第二索引是历史字段的联合语义向量,第三索引是历史字段的字段语义向量; 所述从政务知识图谱中检索相似度最大的历史字段的知识片段,包括:根据目标字段的联合语义向量、字段结构向量和或枚举值向量,以及各自的权重,计算出目标字段的加权融合向量; 按顺序依次计算目标字段的加权融合向量、联合语义向量和字段语义向量与政务知识图谱中各历史字段的第一索引、第二索引和第三索引之间的第一相似度、第二相似度和第三相似度,只要计算的相似度的最大值大于相似度阈值,则获取对应的知识片段后退出检索,包括:如果第一相似度的最大值大于相似度阈值,则获取对应的知识片段包括:第一相似度最大值对应的历史字段的元数据信息,及其关联的历史数据质量检核规则;如果第二相似度的最大值大于相似度阈值,则获取对应的知识片段包括:第二相似度最大值对应的历史字段的元数据信息,以及数据质量检核模板中字段属性一致性检核模板;如果第三相似度的最大值大于相似度阈值,则获取对应的知识片段包括:第三相似度最大值对应的历史字段遵循的数据标准,以及数据标准相关的数据质量检核模板。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都市大数据中心(成都市12345热线服务中心),其通讯地址为:610000 四川省成都市高新区蜀锦路68号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励