Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中铁电气化局集团有限公司林云志获国家专利权

中铁电气化局集团有限公司林云志获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中铁电气化局集团有限公司申请的专利一种数据搜索增强重排方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120067311B

龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510552027.X,技术领域涉及:G06F16/338;该发明授权一种数据搜索增强重排方法、系统及设备是由林云志;杨柳;裴宁;张浩宇;罗金;司丙楠设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。

一种数据搜索增强重排方法、系统及设备在说明书摘要公布了:本发明属于数据搜索增强领域,具体涉及了一种数据搜索增强重排方法、系统及设备,旨在解决现有RAG技术因局部匹配、单一表征和噪声干扰导致准确率低的问题。本发明包括:构建关键词库;将专业知识及文档分割为多个文本块,生成第一高维特征向量;对每个文本块语义分割,提取各语义单元的第二高维特征向量;提取查询信息的关键词、各改写查询的高维特征向量;筛选与查询信息的关键词匹配的多个文本块;将查询信息的关键词对应的高维特征向量与第一高维特征向量进行匹配,并基于转移概率距离进行二次筛选;计算改写查询对应的高维特征向量与二次筛选后的第二高维特征向量的球散度距离,并进行重排。本发明结合多种语义特征,提升了搜索准确率。

本发明授权一种数据搜索增强重排方法、系统及设备在权利要求书中公布了:1.一种数据搜索增强重排方法,其特征在于,该方法包括: 收集已有领域的专业知识及文档并提取关键词,构建领域对应的关键词库; 将所述专业知识及文档按固定长度分割为多个文本块,对每个文本块,基于关键词库分别提取关键词,并通过文本表征模型生成第一高维特征向量; 对每个文本块进行语义分割,生成多个语义单元,并通过文本表征模型提取各语义单元的高维特征向量,得到第二高维特征向量; 基于所述关键词库提取输入的查询信息的关键词,提取所述查询信息的关键词对应的高维特征向量;获取所述查询信息多种语义等效的改写查询,提取各改写查询对应的高维特征向量; 筛选与查询信息的关键词匹配的多个文本块,作为候选文本块; 将所述查询信息的关键词对应的高维特征向量与所述第一高维特征向量进行匹配,并基于转移概率距离对候选文本块进行二次筛选; 计算改写查询对应的高维特征向量与二次筛选后的第二高维特征向量的球散度距离,基于所述球散度距离对二次筛选后的文本块进行重排; 所述球散度距离,其方法为: 将每个改写查询的高维特征向量集合记为,二次筛选后的第二高维特征向量集合记为;其中,为特征向量的数量,m为的索引; 计算和中,任意两个特征向量之间的欧氏距离;其中,,; 基于所述欧氏距离计算每组特征向量的球散度距离; 基于所述欧氏距离计算每组特征向量的球散度距离,其方法为: ; 其中,表示改写查询的高维特征向量间的组内距离,为二次筛选后的第二高维特征向量间的组内距离,为循环索引变量,用于遍历集合中的元素,取值范围为,为中的第个特征向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中铁电气化局集团有限公司,其通讯地址为:100036 北京市丰台区丰台路口139号202室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。