北京久其软件股份有限公司欧阳标才获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京久其软件股份有限公司申请的专利一种基于多层级聚类的报告代填单位识别方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121117212B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511650528.8,技术领域涉及:G06F16/35;该发明授权一种基于多层级聚类的报告代填单位识别方法和装置是由欧阳标才;党毅;王亚辉;胡通洋;王东浩;赵伯韬;李坤奇;张晓飞;高达;宋晓晨;董移征;郭园;王洋;邓俊波设计研发完成,并于2025-11-12向国家知识产权局提交的专利申请。
本一种基于多层级聚类的报告代填单位识别方法和装置在说明书摘要公布了:本发明提供了一种基于多层级聚类的报告代填单位识别方法和装置,可用于人工智能技术领域,方法包括:获取各目标单位提交的报告文档;对报告文档进行语义段落对齐,得到段落向量索引表;基于多层级聚类算法,根据段落向量索引表依次对语义段落、报告文档和目标单位进行相似性分析,识别出报告代填单位,融合了大模型预处理与局部敏感哈希索引技术,通过语义段落对齐与多层级递进的相似度计算,能够精准识别出由同一机构代填所形成的隐蔽性报告重复群体,细化了查重处理粒度,在保障语义分析精度的同时,通过高效的索引结构与聚类策略显著提升了海量报告的处理效率,实现了检测能力与计算性能的平衡。
本发明授权一种基于多层级聚类的报告代填单位识别方法和装置在权利要求书中公布了:1.一种基于多层级聚类的报告代填单位识别方法,其特征在于,所述方法包括: 获取各目标单位提交的报告文档; 对所述报告文档进行语义段落对齐,得到段落向量索引表,具体包括: 对每个语义段落计算对应的段落指纹,并根据所述段落指纹构建对应的局部敏感哈希向量索引; 根据所述局部敏感哈希向量索引和对应的语义段落,生成段落向量索引表; 基于多层级聚类算法,根据所述段落向量索引表依次对语义段落、报告文档和目标单位进行相似性分析,识别出报告代填单位; 根据所述局部敏感哈希向量索引,对所述语义段落进行层级聚类,得到相似段落聚类结果,所述相似段落聚类结果包括段落聚类簇和对应的语义段落; 针对每个段落聚类簇,查询出包含所述段落聚类簇对应的语义段落的报告文档,构建文档倒排索引; 对每个文档倒排索引对应的报告文档进行两两文档之间的段落聚类簇相似度计算,得到文档间相似度结果; 根据所述文档间相似度结果,对所述报告文档进行聚类,得到相似文档聚类结果,所述相似文档聚类结果包括文档聚类簇和对应的报告文档; 针对每个文档聚类簇,查询出提交所述文档聚类簇对应的报告文档的目标单位,构建单位倒排索引; 对每个单位倒排索引对应的目标单位进行两两单位之间的文档聚类簇相似度计算,得到单位间相似度结果; 根据所述单位间相似度结果,对所述目标单位提交的报告文档进行聚类,得到相似单位聚类结果; 根据相似单位聚类结果,确定出所述报告代填单位。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京久其软件股份有限公司,其通讯地址为:100082 北京市海淀区文慧园甲12号楼1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励