中国计量大学汪湖泉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国计量大学申请的专利一种多源异构目标数据的存储方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119003852B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411484721.4,技术领域涉及:G06F16/951;该发明授权一种多源异构目标数据的存储方法及系统是由汪湖泉;彭飞荣;付宏伟;仵冀颖;彭型娜设计研发完成,并于2024-10-23向国家知识产权局提交的专利申请。
本一种多源异构目标数据的存储方法及系统在说明书摘要公布了:本发明公开了一种多源异构目标数据的存储方法,通过网络爬虫程序模块采集多源异构目标数据,将图像类数据转换为文本数据,统一了多源异构数据的格式;结合聚类算法和TextCNN模型进行目标特征提取,实现了多源异构数据特征的有效融合,并对目标特征信息进行存储,为后续进行市场竞争垄断行为的判断分析模型提供真实的有效数据。
本发明授权一种多源异构目标数据的存储方法及系统在权利要求书中公布了:1.一种多源异构目标数据的存储方法,其特征在于,包括如下步骤: (1)通过网络爬虫程序模块采集多个目标数据,所述目标数据为多源异构,且至少包括文本类数据和图像类数据; (2)通过文本信息提取模块获取所述目标数据对应的文本信息; (3)通过聚类模块对所述文本信息进行聚类融合获得多个文本信息分组; (4)通过目标特征提取模块中的TextCNN模型对每个分组下多个文本信息数据进行特征提取以获得多组目标特征信息; (5)通过特征数据库存储所述多组目标特征信息以供后续进行市场竞争垄断行为的判断分析;其中,所述市场竞争垄断行为覆盖涉嫌垄断协议、经营者集中未依法申报、不公平价格、低于成本销售、差别待遇场景; 其中步骤(2)中获取所述目标数据对应的文本信息包括:对于文本类多源异构数据,直接获取文本信息,对于图像类多源异构数据,利用图像转换文本工具转换为对应的文本信息;所述图像转换文本工具通过编写Python脚本调用“百度智能云”平台中的通用场景文字识别API,将图像类数据转化为文本信息; 其中步骤(3)中对所述文本信息进行聚类融合获得多个文本信息分组通过K-means聚类算法实现; 其中步骤(4)中在TextCNN模型中,将卷积层过滤器的卷积核大小设定为2、3、4,用来提取层次不同的特征,计算方法如下边公式所示: ; 其中:为ReLU函数;表示过滤器的节点,表示过滤器的值;表示第t个节点对应的偏置项,表示在输出矩阵中,第t个节点其所对应过滤器的输入节点所具有的权重;通过设置三个卷积核不同的过滤器来实现提取局部特征的目的,最终得到是卷积层的输出结果,采用最大池化方法实现对卷积层操作的输出的池化处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国计量大学,其通讯地址为:310018 浙江省杭州市钱塘区学源街258号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。