Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京深势科技有限公司李思杭获国家专利权

北京深势科技有限公司李思杭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京深势科技有限公司申请的专利一种结合大语言模型和伪查询技术的稠密检索方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120256573B

龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510332989.4,技术领域涉及:G06F16/3329;该发明授权一种结合大语言模型和伪查询技术的稠密检索方法和装置是由李思杭;王泽辉;高志锋;蔡恒兴;张林峰设计研发完成,并于2025-03-20向国家知识产权局提交的专利申请。

一种结合大语言模型和伪查询技术的稠密检索方法和装置在说明书摘要公布了:本发明实施例涉及一种结合大语言模型和伪查询技术的稠密检索方法和装置,所述方法包括:选择第一大模型;并以BERT模型为第一、第二编码器构建伪查询‑文档评分模型;抽取查询‑反馈种子样本;配置三个大语言模型指令模板;根据种子样本和第一、第二指令模板构建第一数据集、并基于该数据集训练伪查询‑文档评分模型;训练结束后,接收用户侧输入的查询文本和历史检索信息,并基于历史检索信息进行查询‑反馈文本对提取,并基于提取出的文本对序列和查询文本进行伪反馈生成,并由查询、伪反馈组成伪查询,并基于伪查询进行稠密检索得到检索结果向当前用户反馈。本发明可以提高检索准确度、降低检索歧义问题的发生概率。

本发明授权一种结合大语言模型和伪查询技术的稠密检索方法和装置在权利要求书中公布了:1.一种结合大语言模型和伪查询技术的稠密检索方法,其特征在于,所述方法包括: 选择一款已完成预训练和NLP任务微调的生成式大语言模型作为第一大模型;并选择一款已完成预训练的BERT系列模型作为对应的第一编码器和第二编码器,并以所述第一、第二编码器为核心构建伪查询-文档评分模型;并将一个预设的信息文档库作为对应的目标文档库,并对所述目标文档库的知识领域总数进行统计得到对应的总数M;所述伪查询-文档评分模型用于对模型输入的伪查询Q和文档D进行关联性评分处理并输出对应的评分S,所述评分S的取值范围在-1到1之间;所述目标文档库包括多个所述目标文档;每个所述目标文档对应一个知识领域;所述总数M为正整数; 从所述目标文档库的各个知识领域中随机抽取指定数量N1个目标文档作为对应的N1个种子反馈;并为各个所述种子反馈设置一个对应的查询文本记为种子查询;并由各个所述种子查询和对应的所述种子反馈组成一个对应的查询-反馈种子样本;所述指定数量N1为正整数;所述查询-反馈种子样本的总数为N1×M; 配置一个用于以给定样本集为参考、在给定查询不为空时生成一个对应反馈、并在所述给定查询为空时生成一个新的查询-反馈文本对的大语言模型指令模板记为第一指令模板;并配置一个用于为给定正反馈生成指定数量N2个负反馈、并要求正负反馈之间的文本特征相似度高于预设的相似度阈值a但语义相关度低于的预设的相关度阈值b第二指令模板;并配置一个用于以给定检索信息为当前上下文进行查询-反馈文本对提取的第三指令模板;所述指定数量N2为正整数;所述文本特征相似度与所述相似度阈值a的取值范围在0到1之间;所述语义相关度与所述相关度阈值b的取值范围在-1到1之间,所述语义相关度为正数时数值越小则相关性越弱、为负数时说明存在语义矛盾; 根据N1×M个所述查询-反馈种子样本、所述第一指令模板、所述第二指令模板和所述第一大模型为所述伪查询-文档评分模型构建一个模型训练数据集记为第一数据集; 基于所述第一数据集对所述伪查询-文档评分模型进行模型训练; 模型训练结束后,接收用户侧输入的第一查询文本和第一历史检索信息;并基于所述第一历史检索信息、所述第三指令模板和所述第一大模型进行查询-反馈文本对提取处理得到对应的第一文本对序列;并基于所述第一文本对序列、所述第一查询文本、所述第一指令模板和所述第一大模型进行伪反馈生成处理得到对应的第一伪反馈文本;并由所述第一查询文本和所述第一伪反馈文本组成对应的第一伪查询文本;并基于所述第一伪查询文本、所述伪查询-文档评分模型和所述目标文档库进行稠密检索处理得到对应的第一检索结果;并将所述第一检索结果向当前用户反馈;所述第一历史检索信息由当前用户在最近指定时段内的所有检索信息组成。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京深势科技有限公司,其通讯地址为:100089 北京市海淀区海淀大街3号1幢11层1101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。