Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 兵器装备集团财务有限责任公司张斌获国家专利权

兵器装备集团财务有限责任公司张斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉兵器装备集团财务有限责任公司申请的专利信息去重方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120706402B

龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510791531.5,技术领域涉及:G06F40/194;该发明授权信息去重方法是由张斌;尹伊;朱峰;朱红霞;付子君;张子倩设计研发完成,并于2025-06-13向国家知识产权局提交的专利申请。

信息去重方法在说明书摘要公布了:本发明公开了一种信息去重方法,属于信息处理技术领域,包括从不同媒体平台获取与指定对象相关的原始舆情数据集;将原始舆情数据集中各条数据进行一次去重处理后,将一次去重处理后的剩余文本内容输入至预设的规则引擎中,确定剩余数据对应的二次去重方式,其中,所述规则引擎计算当前负载信息,基于负载信息的结果确定二次去重方式,包括如果当前负载信息未超过指定负载,基于剩余数据对应来源确定二次去重方式;基于所述二次去重方式对剩余数据进行二次去重。通过规则引擎采用不同方式去重,能够保证去重的实时性以及提高去重精度。

本发明授权信息去重方法在权利要求书中公布了:1.一种信息去重方法,其特征在于,包括: 从不同媒体平台获取与指定对象相关的原始舆情数据集,其中,每条数据包含文本内容,以及元数据,其中,所述元数据包括发布时间、以及来源; 将原始舆情数据集中各条数据进行一次去重处理后,将一次去重处理后的剩余文本内容输入至预设的规则引擎中,确定剩余数据对应的二次去重方式,其中,所述规则引擎计算当前负载信息,基于负载信息的结果确定二次去重方式,包括如果当前负载信息未超过指定负载,基于剩余数据对应来源确定二次去重方式; 基于所述二次去重方式对剩余数据进行二次去重,包括:针对剩余数据中任两条待去重的数据,如果对应的来源均为第一信源类型,则确定二次去重方式为基于TF‑IDF的第一处理方式,第一信源类型为以短文本为主的社交媒体类型;如果对应的来源均为第二信源类型,则确定二次去重方式为多子级的第二处理方式;第二信源类型是以长文本为主的新闻网站类型;如果对应的来源分别为第一信源类型、第二信源类型,则确定二次去重方式为第三处理方式; 其中,基于所述二次去重方式对剩余数据进行二次去重包括:如果二次去重方式为多子级的第二处理方式,则先采用第一子级处理方式将剩余各条数据中的文本内容Ti分割为指定长度的文本块,并计算每个文本块的哈希值;基于所述哈希值构建倒排索引,以哈希值为键,记录文本块所属文本及位置;基于预构建的倒排索引,比较跨数据不同文本块的哈希值和分块位置,确定跨数据文本块之间是否存在重复的文本块,基于重复的文本块计算数据的重复度,判定数据是否存在重合,并对重合数据执行去重操作;其中,基于重复的文本块的信息、以及获取到的缓存中的当前阈值判定数据是否存在重合; 对第一子级处理方式处理得到的目标数据进行第二子级处理:对每条所述目标数据的文本内容重新分块,其中,采用不同的分块参数对所述目标数据进行动态分块;提取所述动态分块得到的每条数据的文本块的语义特征向量和关键词特征向量;对所述语义特征向量和所述关键词特征向量进行拼接,得到拼接向量;计算各条数据之间文本块位置相似度、并基于所述位置相似度以及拼接向量的相似度进行去重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兵器装备集团财务有限责任公司,其通讯地址为:100089 北京市海淀区车道沟10号院3号科研办公楼5层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。