中国标准科技集团有限公司王岩峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国标准科技集团有限公司申请的专利一种基于目标实体多特征拟态的智能查重检测系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119761339B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510265333.5,技术领域涉及:G06F40/194;该发明授权一种基于目标实体多特征拟态的智能查重检测系统及方法是由王岩峰;许应成;张新;闫淑英;孙雪;蒋宇;朱金刚;任茜设计研发完成,并于2025-03-07向国家知识产权局提交的专利申请。
本一种基于目标实体多特征拟态的智能查重检测系统及方法在说明书摘要公布了:本发明涉及数据检测技术领域,公开了一种基于目标实体多特征拟态的智能查重检测系统及方法,该方法包括:采集待检测目标实体数据,基于自然语言处理对待检测目标实体数据进行分词;提取文本特征以及语义特征;将特征融合获得拟态特征,与历史数据库进行比对,确定查重文件并确定查重相似度;将查重相似度与相似度阈值进行比对判断是否对查重相似度进行调整;当小于相似度阈值时,判定进行调整,并基于图神经网络对分词后的数据进行处理提取结构特征,将结构特征与历史数据库中的历史结构特征进行比对,根据比对结果确定调整系数对查重相似度进行调整。本申请提高了查重的准确性,全面地评估目标文本的相似性,提高了查重的精度和鲁棒性。
本发明授权一种基于目标实体多特征拟态的智能查重检测系统及方法在权利要求书中公布了:1.一种基于目标实体多特征拟态的智能查重检测方法,其特征在于,包括: 采集待检测目标实体数据,基于自然语言处理对所述待检测目标实体数据进行分词; 基于词袋模型对分词后的数据进行处理提取文本特征,基于BERT对分词后的数据进行处理提取语义特征; 将所述文本特征及语义特征融合,获得拟态特征,将所述拟态特征与历史数据库进行比对,确定查重文件并确定查重相似度; 将所述查重相似度与相似度阈值进行比对,根据比对结果判断是否对所述查重相似度进行调整;当所述查重相似度小于所述相似度阈值时,判定对所述查重相似度进行调整,并基于图神经网络对分词后的数据进行处理提取结构特征,将所述结构特征与所述历史数据库中的历史结构特征进行比对,根据比对结果确定调整系数对所述查重相似度进行调整; 根据比对结果确定调整系数对所述查重相似度进行调整时,包括: 选取拟态特征与历史拟态特征的查重相似度最大值对应的历史拟态特征,并获取所述历史拟态特征的历史结构特征,获取所述结构特征与所述历史结构特征的模量差值,根据所述模量差值确定调整系数对所述查重相似度进行调整; 将所述模量差值分别与预先设定的第一预设模量差值以及第二预设模量差值进行比对,根据比对结果确定调整系数对所述查重相似度进行调整;所述第一预设模量差值小于第二预设模量差值; 当所述模量差值小于或等于第一预设模量差值时,确定第一调整系数对所述查重相似度进行调整;当所述模量差值大于第一预设模量差值且小于或等于第二预设模量差值时,确定第二调整系数对所述查重相似度进行调整;当所述模量差值大于第二预设模量差值时,确定第三调整系数对所述查重相似度进行调整;所述第一调整系数大于第二调整系数,所述第二调整系数大于第三调整系数,且所述调整系数取值范围为(0,1),调整后的查重相似度为所述查重相似度与所述调整系数的乘积。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国标准科技集团有限公司,其通讯地址为:100086 北京市海淀区知春路6号(锦秋国际大厦)14层A11;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。