六晟信息科技(杭州)有限公司李盛祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉六晟信息科技(杭州)有限公司申请的专利基于自然语言处理的智能检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120973825B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511516597.X,技术领域涉及:G06F16/2453;该发明授权基于自然语言处理的智能检索方法及系统是由李盛祥;夏佳祥;刘长春;沈奕超设计研发完成,并于2025-10-23向国家知识产权局提交的专利申请。
本基于自然语言处理的智能检索方法及系统在说明书摘要公布了:本发明涉及检索技术领域,具体涉及基于自然语言处理的智能检索方法及系统。其方法包括:获取查询及候选文档集并计算查询向量和文档向量,构建与查询相关的分层概念超图,生成语义特征和文本结构特征,获取排序模型训练数据集并计算目标梯度Lambda值,采用两阶段交替优化策略训练排序模型,在梯度提升决策树模型训练阶段更新梯度提升决策树模型,在语义特征优化阶段构建优化目标并更新图注意力网络及分层概念超图的可学习参数,重复两阶段交替优化策略直至排序模型收敛,利用排序模型对新的候选文档集排序并输出结果。即本发明的方案能够降低搜索结果的冗余度且提高排序的准确性,有效提升整个检索系统性能,提高整个检索系统的排序效果。
本发明授权基于自然语言处理的智能检索方法及系统在权利要求书中公布了:1.基于自然语言处理的智能检索方法,其特征在于,包括: 获取查询及候选文档集,并利用预训练语言模型计算查询向量和文档向量; 基于候选文档集的全局语义,并结合查询向量对语义空间的偏移作用,构建与查询相关的分层概念超图,包括:利用预训练语言模型分别对查询和候选文档集中的文档编码,得到查询向量和文档向量集合;对文档向量进行聚类分析得到多个初始语义簇,获得表示候选文档集整体语义分布的语义空间;将查询向量投影到语义空间中,计算其与各初始语义簇中心的相似度,根据相似度大小生成查询相关的语义偏移权重;利用语义偏移权重对初始语义簇中心加权调整,使簇中心位置朝向与查询向量更相近的方向偏移;基于调整后的语义簇构建多层级的概念节点;在不同层级之间建立超边得到分层概念超图; 通过图注意力网络在分层概念超图上传播和聚合查询向量与文档向量,生成多尺度的语义概念特征作为语义特征;结合候选文档集中文档的实体链接密度和主题熵,生成文本结构特征; 获取排序模型训练数据集,对于数据集中任意一对具有不同相关性等级的文档对,根据NDCG评估指标增益、基于语义因子分解的冗余惩罚项以及基于用户会话历史的偏差校正项计算目标梯度Lambda值; 采用两阶段交替优化策略训练排序模型;在梯度提升决策树模型训练阶段,固定图注意力网络及分层概念超图的可学习参数,利用语义特征、文本结构特征和目标梯度Lambda值更新梯度提升决策树模型;在语义特征优化阶段,固定梯度提升决策树模型,基于梯度提升决策树模型中语义特征的分裂增益构建优化目标,反向传播更新图注意力网络及分层概念超图的可学习参数; 重复两阶段交替优化策略直至排序模型收敛,利用排序模型对新的候选文档集进行排序并输出结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人六晟信息科技(杭州)有限公司,其通讯地址为:311100 浙江省杭州市余杭区仓前街道欧美金融城5幢2401-3室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励