昆明理工大学贾连印获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于签名的集合语义相似度连接方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119829743B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510027523.3,技术领域涉及:G06F16/334;该发明授权一种基于签名的集合语义相似度连接方法是由贾连印;曾成晨;李孟娟;丁家满;游进国;李润鑫;李晓武;曾瑞设计研发完成,并于2025-01-08向国家知识产权局提交的专利申请。
本一种基于签名的集合语义相似度连接方法在说明书摘要公布了:本发明涉及一种基于签名的集合语义相似度连接方法,属于数据库和信息检索领域。包括四部分内容:首先,分类树构建步骤:给定数据集,根据WordNet知识库构建分类树;其次,集合签名步骤:将数据集中每个集合进行签名,获得对应的签名数据集;随后,数据预处理步骤:将签名数据集中集合进行排序,得到排序后的数据集;最后,连接处理步骤:对排序后的数据集中的集合执行自连接,获得语义相似结果对集。本发明基于签名前缀过滤技术、长度过滤技术,最终实现集合语义相似度连接方法,可有效提高集合语义连接效率。
本发明授权一种基于签名的集合语义相似度连接方法在权利要求书中公布了:1.一种基于签名的集合语义相似度连接方法,其特征在于: Step1:对给定数据集D,根据WordNet知识库构建分类树T; Step2:将数据集D中每个集合S进行签名,获得对应的签名集Dsig; Step3:将签名集Dsig中集合按集合长度升序排序,集合中的元素按签名频率升序排序,得到排序后的数据集DO; Step4:对排序后的数据集DO中的集合执行自连接,获得语义相似结果对集R; 所述Step1具体为: Step1.1:给定数据集D,从数据集D中抽取所有出现在WordNet知识库中的词汇; Step1.2:对每个出现在WordNet中的词汇w,识别WordNet中从词汇w到根节点的路径P,并根据路径P中所有出现在数据集D中的词汇沿WordNet中从叶到根的顺序构造一个新路径P*; Step1.3:将新路径P*中的节点依次插入到分类树中,构建一个精简的分类树T; 所述Step2具体为: Step2.1:给定元素语义相似度阈值和集合语义相似度阈值θ,计算 Step2.2:对数据集D中每个集合S,按以下步骤生成S的签名S*: 对S中的每个元素e,若e不在分类树T中或在分类树T中的深度小于则置e的元素签名ge=e,否则置其中为e在分类树T中深度为的祖先节点; 将S中的每个元素e替换为对应的元素签名ge,获得集合签名集S*,所有集合的签名集最终构成签名数据集Dsig; 所述Step3具体为: Step3.1:统计签名数据集Dsig中所有独立签名元素的频率; Step3.2:对签名数据集Dsig中的所有集合按集合长度升序排序,并且每个集合中的签名元素按频率升序排序,得到排序后的数据集DO; Step3.3:对排序后数据集DO中的集合从0至|DO|-1依次赋予编号ID。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650031 云南省昆明市一二一大街文昌路68号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励