中国航天科技国际交流中心;铭台(北京)科技有限公司展鹏飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国航天科技国际交流中心;铭台(北京)科技有限公司申请的专利一种基于数据图像化的网络文章与主题相关性分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740731B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310623296.1,技术领域涉及:G06V30/18;该发明授权一种基于数据图像化的网络文章与主题相关性分析方法是由展鹏飞;杨蕾;赵屾;邓刚;吴之尧;索阿娣;李东;陈伟;于珊珊;张强;王斌;李秋晗;史建华;岳笠设计研发完成,并于2023-05-30向国家知识产权局提交的专利申请。
本一种基于数据图像化的网络文章与主题相关性分析方法在说明书摘要公布了:本申请公开了一种基于数据图像化的网络文章与主题相关性分析方法,包括:获取待处理的文本数据;基于预先构建的映射表,将所述待处理的文本数据转变为第一特征图;以及统计各词组在所述文本数据中出现的位置,并基于各词组的出现位置构建第二特征图;将所述第一特征图和所述第二特征图作为两通道数据融合,并输入训练好的图像分类模型,以利用训练好的所述图像分类模型完成相关性判断。本申请实施例先利用自然语言预处理技术抽取文章的有效特征,再进行特征图像化,最后利用卷积神经网络进行分类及计算与目标主题的相关性,实现准确、快速、低功耗数据分析。
本发明授权一种基于数据图像化的网络文章与主题相关性分析方法在权利要求书中公布了:1.一种基于数据图像化的网络文章与主题相关性分析方法,其特征在于,包括如下步骤: 获取待处理的文本数据; 基于预先构建的映射表,将所述待处理的文本数据转变为第一特征图;以及 统计各词组在所述文本数据中出现的位置,并基于各词组的出现位置构建第二特征图; 将所述第一特征图和所述第二特征图作为两通道数据融合,并输入训练好的图像分类模型,以利用训练好的所述图像分类模型完成相关性判断; 采用如下方式预先构建映射表: 取常用词组作为训练集,并将常用词组按行列排列; 计算各词组的逆文本频率指数,满足:,其中D为总网页数,为第i行第j列词组对应的网页数; 按照词组的排列方式,对应生成逆文本频率指数表IDF表; 设置常用主题及关键词,作为文章分类目标; 构建所述IDF表与文章分类目标之间的映射关系,即为所述映射表; 基于预先构建的映射表,将所述文字向量转变为第一特征图包括: 计算取待处理的文本数据中的文本词频二维矩阵,满足: 其中,为第i行第j列对应的词组在文本数据中的出现次数,M为文本数据的总词组数; 进行归一化: 归一化后,获得第一特征图; 统计各词组在所述文本数据中出现的位置,并基于各词组的出现位置构建第二特征图包括: 为各词组在所述文本数据中出现的位置配置对应的标记,按照各词组在所述文本数据中出现的顺序,构建第二特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国航天科技国际交流中心;铭台(北京)科技有限公司,其通讯地址为:100048 北京市海淀区阜成路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励