中国经济信息社有限公司王纯刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国经济信息社有限公司申请的专利一种基于多模态大模型的新闻分析方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118535978B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410535593.5,技术领域涉及:G06F18/2411;该发明授权一种基于多模态大模型的新闻分析方法及系统是由王纯刚;史峰霖;王文文;李超设计研发完成,并于2024-04-30向国家知识产权局提交的专利申请。
本一种基于多模态大模型的新闻分析方法及系统在说明书摘要公布了:本发明提供一种基于多模态大模型的新闻分析方法及系统,涉及新闻分析技术领域,方法包括:对采集到的多模态数据进行预处理;通过多模态大模型将预处理后多模态数据转换成文本数据并进行特征提取,得到多个新闻的多个语义特征向量;分别计算多个新闻的多个语义特征向量相似度值,得到多个新闻的多个相似特征向量;分别对多个新闻的多个相似特征向量进行权重计算,得到多个新闻的最优相似新闻;分别根据多个新闻的最优相似新闻生成对应的新闻关系网络,分别对多个新闻关系网络进行分析,得到多个新闻主题。本发明通过生成的新闻主题和新闻关系网络将有相似信息的新闻关联起来,得到了新闻的传播路径,实现快速且准确地对新闻进行溯源。
本发明授权一种基于多模态大模型的新闻分析方法及系统在权利要求书中公布了:1.一种基于多模态大模型的新闻分析方法,其特征在于,包括如下步骤:从指定新闻媒体平台中以多种模态的形式采集与新闻相关的数据,得到多个新闻对应的多模态数据,对多个所述多模态数据进行预处理,具体为:通过预构建的大数据处理平台对多个所述多模态数据进行分片处理,得到多个分片数据组,所述分片数据组包括多个所述多模态数据,分别对每个分片数据组的多个所述多模态数据进行哈希计算,得到每个分片数据组对应的多个哈希多模态数据,分别对每个分片数据组对应的多个所述哈希多模态数据进行去重处理,得到每个分片数据组对应的多个去重多模态数据,分别对每个分片数据组对应的所述去重多模态数据进行数据优化,得到每个分片数据组对应的多个优化多模态数据,将每个分片数据组对应的多个所述优化多模态数据合并,得到多个预处理后多模态数据;通过多模态大模型分别对多个预处理后多模态数据进行模态转换,得到多个新闻对应的多个语义文本数据,并分别对多个新闻的多个所述语义文本数据进行特征提取,得到多个新闻对应的多个语义特征向量并存入向量数据库;分别计算多个新闻的多个所述语义特征向量与所述向量数据库中的多个语义特征向量之间的相似度,得到多个新闻对应的多个相似特征向量,分别将多个新闻的多个所述语义特征向量与对应的多个所述相似特征向量进行权重计算,得到多个新闻对应的最优相似新闻;分别根据多个新闻对应的最优相似新闻生成多个对应的新闻关系网络,分别对多个所述新闻关系网络中多个新闻的所有所述语义特征向量进行分析,得到多个新闻关系网络对应的新闻主题;所述分别对多个所述新闻关系网络中多个新闻的所有所述语义特征向量进行分析,得到多个新闻关系网络对应的新闻主题,具体为:通过嵌入层、编码层、解码层和输出层构建标题生成模型,包括:将所述嵌入层的输出与所述编码层的输入连接,将所述编码层的输出与所述解码层的输入连接,将所述解码层的输出与所述输出层的输入连接,完成标题生成模型的构建;通过所述嵌入层获取对应的新闻关系网络中多个新闻的所有所述语义特征向量,通过所述编码层提取多个所述语义特征向量之间的依赖特征表示,通过所述解码层将所述依赖特征表示构建成主题文本序列,通过所述输出层将所述主题文本序列转换成新闻主题,以此类推,直至生成多个所述新闻关系网络的主题,得到多个新闻关系网络对应的新闻主题。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国经济信息社有限公司,其通讯地址为:100053 北京市西城区宣武门西大街57号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励