清华大学唐杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利自然语言到结构化查询生成方法、装置、电子设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119848075B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411600102.7,技术领域涉及:G06F16/2452;该发明授权自然语言到结构化查询生成方法、装置、电子设备及介质是由唐杰;王伟;东昱晓设计研发完成,并于2024-11-11向国家知识产权局提交的专利申请。
本自然语言到结构化查询生成方法、装置、电子设备及介质在说明书摘要公布了:本申请涉及一种自然语言到结构化查询生成方法、装置、电子设备及介质,其中,方法包括:对人工标注样本数据集进行结构化细粒度分解,以得到每种查询模式下的结构化细粒度分解过程;基于自然语言样本问题和结构化细粒度分解过程构造自动训练集;利用自动训练集调节目标基础模型,得到相应的查询模型,以利用查询模型将自然语言问题转化为结构化细粒度分解的结构化查询语言。由此,解决了相关技术中,未考虑到复杂SQL的结构特性以及SQL片段与自然语言问题的细粒度对应性,从而影响查询结果,鲁棒性较差,且难以有效应对复杂自然语言问题的技术问题。
本发明授权自然语言到结构化查询生成方法、装置、电子设备及介质在权利要求书中公布了:1.一种自然语言到结构化查询生成方法,其特征在于,应用于模型构建阶段,其中,所述方法包括以下步骤: 对人工标注样本数据集进行结构化细粒度分解,以得到每种查询模式下的结构化细粒度分解过程; 基于自然语言样本问题和所述结构化细粒度分解过程构造自动训练集; 利用所述自动训练集调节目标基础模型,得到相应的查询模型,以利用所述查询模型将自然语言问题转化为结构化细粒度分解的结构化查询语言; 其中,所述结构化细粒度分解包括:确定选择内容SELECT,确定条件内容WHERE,确定分组GROUP和排序内容ORDER,确定表格连接JOIN; 其中,在对人工标注样本数据集进行结构化细粒度分解之前,还包括:确定自然语言问题的关键词,其中,所述关键词包括选择内容、条件内容、分组及排序内容和表格连接;基于所述关键词定义结构化细粒度分解; 其中,在对人工标注样本数据集进行结构化细粒度分解,以得到每种查询模式下的结构化细粒度分解过程之前,还包括:基于自然语言问题中包括的关键词得到多种查询模式;分析所述人工标注样本数据中的关键词,以确定对应的查询模式; 其中,所述基于自然语言样本问题和所述结构化细粒度分解过程构造自动训练集,包括:获取自然语言样本问题中的待标注数据集;从所述待标注数据集中提取关键词,并基于所述关键词确定对应的查询模式;结合所述查询模式、由用户输入得到的数据库相关信息和所述结构化细粒度分解过程得到对应的提示;基于所述提示得到思维链标注结果,以利用所述思维链标注结果构造所述自动训练集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励