深圳唯爱智云科技有限公司周智欣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳唯爱智云科技有限公司申请的专利基于大语言模型的正则表达式生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120011524B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510487076.X,技术领域涉及:G06F16/3329;该发明授权基于大语言模型的正则表达式生成方法及装置是由周智欣;陈超斌;游克海设计研发完成,并于2025-04-18向国家知识产权局提交的专利申请。
本基于大语言模型的正则表达式生成方法及装置在说明书摘要公布了:本说明书实施例提供基于大语言模型的正则表达式生成方法及装置,其中所述基于大语言模型的正则表达式生成方法包括:在样本库中选择意图标签相同的候选样本组成多个意图文档,其中,候选样本基于文本数据和所述文本数据对应的意图标签组成;提取每个意图文档对应的意图关键词,并通过对所述意图关键词进行聚类,获得目标意图标签对应的意图关键词集合;利用大语言模型按照目标提示词对所述意图关键词集合进行处理,获得所述目标意图标签对应的正则表达式;将所述正则表达式存储至正则库,其中,所述正则库存储的正则表达式用于在问答交互阶段识别用户问答意图。
本发明授权基于大语言模型的正则表达式生成方法及装置在权利要求书中公布了:1.一种基于大语言模型的正则表达式生成方法,其特征在于,包括: 获取文本数据,并利用正则库中存储的正则表达式对所述文本数据进行正则匹配,在匹配失败的情况下,将所述文本数据输入至大语言模型进行意图识别,获得所述文本数据对应的意图标签;基于所述文本数据和所述文本数据对应的意图标签构建候选样本,并将所述候选样本存储至样本库;在样本库中选择意图标签相同的候选样本进行拼接组成多个意图文档,其中,候选样本基于文本数据和所述文本数据对应的意图标签组成,每个意图文档对应一个意图标签; 提取每个意图文档对应的意图关键词,并通过对所述意图关键词进行聚类,获得目标意图标签对应的意图关键词集合,其中,每个意图文档对应的意图关键词来自于组成意图文档的不同候选样本,且通过关键词提取算法和关键词去重算法确定;所述目标意图标签对应的意图关键词集合的确定,包括:确定所述目标意图标签对应的多个待聚类意图关键词,其中,所述多个待聚类意图关键词属于所述目标意图标签对应的意图文档;通过语义识别模型对所述多个待聚类意图关键词分别进行语义识别,获得每个待聚类意图关键词对应的语义向量;利用聚类算法对每个待聚类意图关键词对应的语义向量进行处理,根据处理结果构建所述目标意图标签对应的意图关键词集合; 利用大语言模型按照目标提示词对所述意图关键词集合进行处理,获得所述目标意图标签对应的白正则表达式和黑正则表达式,其中,所述白正则表达式用于匹配标准格式,所述黑正则表达式用于处理非结构化数据; 将所述白正则表达式和所述黑正则表达式存储至正则库,其中,所述正则库存储的正则表达式用于在问答交互阶段识别用户问答意图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳唯爱智云科技有限公司,其通讯地址为:518024 广东省深圳市罗湖区清水河街道清水河社区清水河一路112号罗湖投资控股大厦裙楼304、306单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。