东南大学;国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院毕胜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学;国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院申请的专利一种案件检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119597906B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411810446.0,技术领域涉及:G06F16/334;该发明授权一种案件检索方法是由毕胜;冯煜清;徐磊;黄成燕;查小云;张星;丁群晏;王小波;于淼;张弛设计研发完成,并于2024-12-10向国家知识产权局提交的专利申请。
本一种案件检索方法在说明书摘要公布了:本发明公开了一种案件检索方法,首先通过一种基于堆栈的编码方法对企业案件文档进行编码,该方法在Transformer编码器的基础上,引入了堆栈模拟层来建模长文本的递归状态。然后提出了一种基于结构化信息保留的案件文档向量的降维算法,使用一个基于变分自编码器和随机四重损失的深度学习模型,对案件文档向量进行降维表示,有效地保留了案件文档结构化信息。同时,设计了面向结构保留的向量降维评估方案。最后,为了提高用户检索的精确度,提出了一种基于案件文档与检索匹配得分的重排方法,该方法将已排序的其他候选文档的上下文信息考虑在内,利用上下文的轻量级重排序框架显著增强检索模型的效果。
本发明授权一种案件检索方法在权利要求书中公布了:1.一种案件检索方法,其特征在于,所述方法包括如下步骤: 采用预训练语言模型BERT对于给定的用户检索query进行编码,获得向量表示Q,采用基于堆栈的编码算法对企业案件文档进行编码,获得向量表示D={d1,d2,...,dn},对得到的案件文档向量表示D,通过基于结构化信息保留的案件文档向量的降维算法,对案件文档向量进行降维表示,得到低维案件文档向量表示D′,对得到的用户检索向量Q和得到的案件文档向量D′,设计一种基于案件文档与用户检索匹配得分的重排方法,返回检索结果; 其中,基于案件文档与用户检索匹配得分的重排方法,具体如下:将用户检索向量Q和降维后的企业案件文档向量D′作为输入,使用打分函数τ·分别计算每个企业案件文档与用户检索的匹配得分,计算过程中,使用可学习的线性投影函数对文档向量进行调整,潜在地改变文档向量的维度D′以适应不同的打分函数,同时匹配检索向量Q的维度; 采用基于堆栈的编码算法对企业案件文档进行编码,对于企业案件文档,使用变换网络Transformer进行编码获得隐状态序列在Transformer编码器的基础上,引入了堆栈模拟层,用于建模长文本的递归状态; 针对结构化信息保留的案件文档向量的降维算法,设计一种面向结构保留的向量降维评估方案; 面向结构保留的向量降维评估方案,使用RNX曲线作为质量评估指标,具体设计流程如下: 首先,将高维案件文档向量和降维后的低维案件文档向量进行比对,对于每个文档向量,选择每个文档的向量表示作为参考点并确定其邻域,其次,对于每个文档向量,计算其高维空间与低维空间中的邻居排序之间的重叠度,涵盖了从邻域大小为1到N‑1不同的情况,其中N为样本总数,并对所有参考点取平均值,之后,根据不同邻域大小,绘制RNX曲线,该曲线量化了高维向量和低维向量在不同邻域大小下的重叠情况,体现了降维操作是否有效地保留了文档的结构信息,最后,通过对RNX曲线的分析,评估降维方法对结构化信息保留的有效性,如果重叠度较高,说明降维过程较好地保留了文档的结构信息,否则,需要对降维方法进行调整,以更好地保留文档的结构化信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励