重庆邮电大学王进获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于多模态特征融合的新闻分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115588122B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211383002.4,技术领域涉及:G06V10/764;该发明授权一种基于多模态特征融合的新闻分类方法是由王进;向严;邓龙行;彭云曦;刘彬;朴昌浩设计研发完成,并于2022-11-07向国家知识产权局提交的专利申请。
本一种基于多模态特征融合的新闻分类方法在说明书摘要公布了:本发明属于文本分类领域,具体涉及一种基于多模态特征融合的新闻分类方法,包括:获取原始新闻样本数据;对原始新闻文本进行特征提取得到原始新闻文本向量,对每个原始新闻配图进行特征提取得到每个原始新闻配图的图片序列向量;将原始新闻文本向量和所有原始新闻配图的图片序列向量输入新闻分类模型进行训练;获取目标新闻样本数据,得到目标新闻文本向量和多个目标新闻配图的图片序列向量,将目标新闻文本向量和多个目标新闻配图的图片序列向量输入新闻分类模型得到目标新闻样本数据的分类结果,本发明通过对新闻文本和新闻中的配图进行特征提取从而对用户上传至社交平台的新闻进行分类,使分类的结果具有更高的准确性和可信度。
本发明授权一种基于多模态特征融合的新闻分类方法在权利要求书中公布了:1.一种基于多模态特征融合的新闻分类方法,其特征在于,包括以下步骤: S1:获取原始新闻样本数据;所述原始新闻样本数据包括:原始新闻文本和多个原始新闻配图;对原始新闻样本数据打上标签信息;并将每个原始新闻配图划分为p个尺度相同的图像块得到每个原始新闻配图的图像集; S2:对原始新闻文本进行特征提取得到原始新闻文本向量,对每个原始新闻配图的图像集进行特征提取得到每个原始新闻配图的图片序列向量; S3:构建新闻分类模型,所述新闻分类模型包括:LSTM、注意力网络、门控记忆网络、跨注意力网络、softmax函数; S4:将原始新闻文本向量和所有原始新闻配图的图片序列向量作为训练样本对新闻分类模型进行训练; 所述将原始新闻文本向量和原始新闻图片向量序列作为训练样本对新闻分类模型进行训练包括: S41:将所有原始新闻配图的图片序列向量输入LSTM计算得到当前时间步每个图片序列向量的隐层状态向量; S42:将当前时间步所有图片序列向量的隐层状态向量进行拼接得到当前时间步的第一组合向量; S43:将当前时间步的第一组合向量和上一时间步的第一组合向量进行特征拼接得到当前时间步的第二组合向量; S44:将当前时间步的第二组合向量输入自注意力网络通过注意力机制得到当前时间步第二组合向量的重要性分数矩阵; S45:将当前时间步的第二组合向量与当前时间步第二组合向量的重要性分数矩阵做哈达玛积计算得到当前时间步的第三组合向量; S46:将当前时间步的第三组合向量输入门控记忆网络计算得到当前时间步的第四组合向量,在每一个时间步第一组合向量、第二组合向量、第三组合向量和第四组合向量都会进行更新;当LSTM收敛时即在最后一个时间步时,门控记忆网络计算得到的第四组合向量为最终组合向量; S47:将最终组合向量和原始新闻文本向量输入跨注意力网络计算得到多模态融合向量; S48:将多模态融合向量输入softmax函数计算得到原始新闻样本数据的类别预测结果; S49:根据原始新闻样本数据的类别预测结果和原始新闻样本数据的标签信息利用交叉熵损失函数通过反向传播机制更新新闻分类模型的参数; S5:获取目标新闻样本数据,对目标新闻样本数据进行特征提取得到目标新闻文本向量和多个目标新闻配图的图片序列向量,将目标新闻文本向量和多个目标新闻配图的图片序列向量输入新闻分类模型得到目标新闻样本数据的分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。