北京理工大学李国政获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种面向大规模新闻源媒体偏差识别的可视分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117609522B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311124575.X,技术领域涉及:G06F16/44;该发明授权一种面向大规模新闻源媒体偏差识别的可视分析方法是由李国政;吴季荷;韩昰昱;胡家乐;刘驰设计研发完成,并于2023-09-01向国家知识产权局提交的专利申请。
本一种面向大规模新闻源媒体偏差识别的可视分析方法在说明书摘要公布了:本发明公开了一种面向大规模新闻源媒体偏差识别的可视分析方法,包括以下步骤:步骤1,基于全球新闻开放数据集GDELT构建数据语料库;步骤2,基于大规模媒体来源相关报道构建报道特征时序编码并降维表征;步骤3,构建层次化媒体聚簇可视结果,步骤4,根据用户选定的代表性媒体生成媒体在不同事件类型上报道差异的可视化结果,步骤5,构建选定媒体在特定话题下相关新闻报道的事件发展脉络:步骤6,用户基于事件发展脉络交互对比分析特定事件发展路径中媒体偏差的连续演变模式,本发明为用户提供了直观的交互平台来探索媒体偏差识别结果,降低了用户阅读理解来自不同媒体源的新闻报道工作量,提升了研究效率并帮助用户更深入地了解媒体偏见。
本发明授权一种面向大规模新闻源媒体偏差识别的可视分析方法在权利要求书中公布了:1.一种面向大规模新闻源媒体偏差识别的可视分析方法,其特征在于,包括以下步骤: 步骤1,基于全球新闻开放数据集GDELT构建数据语料库,针对全球新闻开放数据集GDELT进行数据语料库构建,包括两部分:一是全球新闻报道事件数据库的构建;二是新闻报道语料库的构建,支持用户探索分析不同新闻主题下的媒体偏差; 步骤2,基于大规模媒体来源相关报道构建报道特征时序编码并降维表征,采用变分自动编码器构建全球媒体时序编码与降维表征根据以下三方面的需求:第一个方面是动态性,即模型应该具有描述不同时间段内媒体报道偏差动态变化的能力;第二个方面是简洁性,即利用二维平面中点的相对距离描述不同媒体报道偏差的远近;第三个方面是时效性,即根据用户选择的感兴趣的时间段快速响应得到全球媒体偏差二维分布图; 步骤3,构建层次化媒体聚簇可视结果,基于步骤2得到的媒体报道偏差的二维表示通过层次聚类方法与考虑媒体的报道数量的因素来选取不同层次的代表性媒体以便于用户更好地分析聚簇之间、聚簇内部的媒体报道偏差,使得用户在不同的探索层次对比不同的媒体偏差聚簇表示并实现了媒体报道偏差聚簇的层次性探索与基于媒体名称模糊匹配的偏差聚簇定位; 步骤4,根据用户选定的代表性媒体生成媒体在不同事件类型上报道差异的可视化结果,话题对比视图中事件分类部件通过GDELT数据库的CAMEO事件类别编码信息,使用条形码树可视化形式可视化所选媒体在报道上的类别分布并体现出事件的类别的层次化结构,支持用户点击来交互探索特定媒体的特定事件类别分布情况并进行媒体之间对比,所述话题对比视图在本发明中指代生成的媒体在不同事件类型上报道差异的可视化结果; 通过GDELT数据库中的事件发起方和事件接收方信息,话题对比视图通过矩阵样式的可视化形式来展现不同媒体在报道特定主体在作为事件的发起方和事件的接收方时的媒体态度,矩阵可视化形式与事件选择部件进行统一联动,即随着用户选择的事件的类别改变,矩阵可视化形式中事件的事件类别也会随之改变; 步骤5,构建选定媒体在特定话题下相关新闻报道的事件发展脉络: 步骤5.1,媒体对特定话题的偏见反映在一段时间内的整体新闻报道,而不是孤立的新闻文章,要分析媒体在报道某一特定话题时的一贯支持或反对某一特定观点的倾向用户需要媒体在时间跨度内的完整上下文信息,呈现各种类型的信息,包括复杂的拓扑结构,事件演变,事件概述,摘要文本信息,以使用户能够分析其新闻报道的演变从而分析媒体偏差,采用基于路径感知的故事脉络构建算法对输入的新闻文档进行处理并通过构建关键词共现图反复切除介质中心度最大的边来进行话题聚类,基于提取的话题通过基于路径感知的故事脉络构建算法来构建故事脉络并结合可视化的方法来让用户从媒体报道演变中进一步分析媒体偏差; 步骤5.2,故事脉络构建是一个迭代过程,针对每一时间周期新生成的事件节点,故事脉络构建算法会综合评估事件节点放到故事脉络上所有位置的兼容性,在故事脉络构建算法中根据时间间隔、节点一致性、路径一致性以及话题一致性四个因素迭代构建事件脉络,即对于每一个传入事件Enew和现有的故事脉络T,通过将事件Enew放在合适的位置来不断对现有故事脉络添加事件节点,采用两种类型的操作将传入事件放入故事脉络中即合并和连接,首先遍历故事脉络上的所有节点,以评估新事件和脉络中现有事件是否代表相同的主题并通过计算两个文档的TF-IDF向量之间的余弦相似度来实现,当相似度超过某个阈值,将新事件Enew与树中的现有事件Ej合并,否则,继续遍历并计算新事件Enew与每个脉络中现有事件Ej之间的连接概率Pcon,计算连接概率时根据三个因素:1两个事件之间的时间间隔timegap,2两个事件节点之间的节点一致性esim,以及3当事件Enew连接在事件脉络中Ej后面时的路径一致性pcoh,两个事件之间当时间相隔越久则其相关性就会越低,时间间隔的计算方式如下所示: 其中,是事件Ej发生的时间节点,是事件Enew发生的时间节点,通过事件的关键词集合通过TF-IDF向量化事件并评估事件节点与故事脉络节点以及路径上相邻节点之间的余弦相似性来评估节点一致性以及路径一致性,节点一致性计算方式如下: 其中,TF-IDFdj和TF-IDFdnew分别是事件dj和dnew的TF-IDF向量化表示; 而路径一致性的计算方式如下: 其中,LT,j,new表示当事件Enew连接在事件脉络中Ej后面,从T的根节点到节点Enew的路径,|LT,j,new|表示路径的长度; 将路径上所有节点向量通过SVD进行数据降维,再与新事件节点Enew计算余弦相似度,通过余弦相似度评估新事件节点Enew与故事脉络分支路径上整体话题的兼容性以判断新事件节点放到故事脉络的位置是否合适以保持话题一致性的效果,最后根据时间间隔、节点一致性、路径一致性及话题一致性四个因素迭代构建事件脉络; 步骤6,用户基于事件发展脉络交互对比分析特定事件发展路径中媒体偏差的连续演变模式,根据步骤5中构建的事件发展故事脉络以及步骤1中构建的数据语料库,完成事件发展故事脉络可视化结果的展示同时支持用户交互式探索的过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励