粤港澳国际供应链(广州)有限公司洪志权获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉粤港澳国际供应链(广州)有限公司申请的专利中文自然语言生成SQL语句及跨数据库查询方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115576984B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211109934.X,技术领域涉及:G06F16/2453;该发明授权中文自然语言生成SQL语句及跨数据库查询方法是由洪志权;蔡昆颖;于崇刚;庄士超;许文设计研发完成,并于2022-09-13向国家知识产权局提交的专利申请。
本中文自然语言生成SQL语句及跨数据库查询方法在说明书摘要公布了:本发明涉及一种中文自然语言生成SQL语句及跨数据库查询方法包括对自然语言语句进行预处理,获取短语片段并将短语片段划分成多个备选分段;若备选分段被符号包围,则将备选分段标记为值;然后,根据预设的词典,获取其余备选分段的同义词;将备选分段和同义词与预设的元数据数据库中的表注释、字段注释及标签元数据进行匹配,根据备选分段匹配到的表注释、字段注释或标签元数据,获取数据库名并将备选分段和同义词标记为表名、字段名或值,然后,生成一个新的字符串;通过对字符串编码解码,结合所述值,根据SQL语法规则生成SQL。本发明可以提高SQL语句在应用与对应的领域中进行深入查询时的准确性,减少出现查询结果与用户查询的真实意图不符的情况。
本发明授权中文自然语言生成SQL语句及跨数据库查询方法在权利要求书中公布了:1.一种中文自然语言生成SQL语句方法,其特征在于:包括以下步骤: S101,对自然语言语句进行预处理,获取所述自然语言语句包含的短语片段; S102,将所述短语片段划分成多个备选分段; S103,判断所述备选分段在所述预处理前是否被符号包围,若所述备选分段被符号包围,则将所述备选分段标记为值,所述值是元数据数据库的表的字段中对应的具体内容; S104,若所述备选分段不被符号包围,根据预设的词典,获取所述备选分段的同义词; S105,将所述备选分段和所述同义词与预设的元数据数据库中的表注释、字段注释及标签元数据进行匹配,其中,所述元数据数据库中包含有多个数据库的表注释、字段注释及标签元数据; S106,若所述备选分段和或所述同义词匹配到所述表注释,将所述备选分段标记为表名;若所述备选分段和或所述同义词匹配到所述字段注释,则将所述备选分段标记为字段名;若所述备选分段和或所述同义词匹配到所述标签元数据,则将所述备选分段标记为值;根据所述备选分段和所述同义词匹配到的表注释、字段注释或标签元数据,获取对应的数据库的数据库名; S107,将所述数据库名、表名和字段名以及自然语言语句形成一个新的字符串; S108,将所述字符串编码,生成向量; 所述编码包括以下步骤: 用微调参数的语言理解模型对所述字符串X和所述自然语言语句Q进行编码,获得隐藏层输出HX和HQ; 将所述HX和HQ输入双向长短期记忆网络,获得编码hX和hQ; 计算表编码向量v=1,2,…,T,D={Di},其中Di中i=1,2,…,Δ:其中,所述D表示数据库集合,所述Di是第i个数据库,所述Δ是数据库集合中一共有Δ个数据库,所述是第i个数据库中的第v张表,所述T是第i个数据库中一共有T张表,所述是表在所述字符串X中的索引,所述是hX中对应索引的表的编码向量,所述是和零向量[000]组成的增广矩阵,f·是一个前馈层网络函数; 计算字段编码向量其中j=1,2,…,Γ:其中,所述表示第i个数据库中的第v张表中的第j个字段,所述Γ是第i个数据库中的第v张表中一共有Γ个字段,所述是所述字符串X中字段的索引,是hX中对应索引的字段的编码向量,所述Ft、Ff和Fp是从所述元数据数据库中获取的特征向量; 根据所述表编码向量和所述字段编码向量,形成表编码向量增广矩阵: 计算所述表编码向量增广矩阵,形成数据库编码向量: 计算所述数据编码向量,形成数据库集合编码向量: 计算完整的编码向量:he=[hQhD]; S109,将所述向量解码,根据SQL语法规则,结合所述值,生成SQL语句; 所述解码包括以下步骤: 获取解码器神经网络的第x个时间步,其隐藏层状态sx,其中s1=he,第hh∈[1,2,…,H]个注意力头; 计算比较函数:其中所述hy是所述编码向量he中的第y列向量,所述n是所述编码向量he中的列数,所述是参数矩阵,所述中的T表示对转置; 计算权重指数: 计算第x层第h个注意力头的输出:其中,所述|Q|是对自然语言语句Q作为字符串取模,所述|D|是对数据库集合D取模; 计算第x个时间步的注意力头输出: 计算从所述词典V中选取的生成器概率:其中Ws、Wy和b是可学习的参数; 计算从所述词典V中选取词汇v的概率分布: 其中,所述vy表示所述词典中第y个词汇,所述y:vy=v表示当满足vy=v条件时,对进行求和,所述PVv是所述词典中所有单词的LSTMsoftmax概率分布; 选择使得Pxv最大的词汇: 按SQL语法规则,结合所述值,组装SQL。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人粤港澳国际供应链(广州)有限公司,其通讯地址为:510000 广东省广州市南沙区港荣一街3号401-1房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励