中国人民解放军92493部队信息技术中心岳明桥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军92493部队信息技术中心申请的专利一种多模态融合的非结构化数据多元分类分级方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120296558B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510357941.9,技术领域涉及:G06F18/2415;该发明授权一种多模态融合的非结构化数据多元分类分级方法及系统是由岳明桥;马跃飞;张恒博;杨豪璞;胡永涛;李一;李进;于洋;谭天;张杨设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。
本一种多模态融合的非结构化数据多元分类分级方法及系统在说明书摘要公布了:本发明涉及数据安全分类分级技术领域,公开一种多模态融合的非结构化数据多元分类分级方法及系统。分类方法包括:多模态数据融合,包括文档数据多模态融合、图片数据多模态融合、音频数据多模态融合及视频数据多模态融合,以获得融合表征向量;融合表征向量输入神经网络模块,以输出M维向量,M为类别数;对M维向量进行转换,获得概率向量P;基于概率向量P获取多模态数据的多元数据类别;计算非结构化数据的最大数据级别和期望数据级别。本发明引入多模态融合技术,充分挖掘和利用非结构化数据中多种有效信息,采用多元分类分级技术,为非结构化数据赋予多个类别以及最大数据级别和期望数据级别,显著提升了非结构化数据的分类分级效果。
本发明授权一种多模态融合的非结构化数据多元分类分级方法及系统在权利要求书中公布了:1.一种多模态融合的非结构化数据多元分类分级方法,其特征在于,包括如下步骤: S1.多模态数据融合,以获得融合表征向量; S2.所述融合表征向量输入至神经网络模块,以输出M维向量,M为类别数; S3.对M维向量进行转换,获得概率向量P; S4.基于概率向量P获取多模态数据的多元数据类别,具体包括: 元数据至少包括文件名、目录名、创建者、描述性信息、数据源和创建日期; S40.设定参数k和t,k为可选类别的最大值,t为概率阈值; S41.从概率向量P中筛选出概率值大于等于概率阈值t的类别; S42.对筛选出的类别按照概率值的降序排序,当筛选出的类别的数量大于等于k时,取前k个类别作为非结构化数据的多元数据类别;当筛选出的类别的数量小于k时,则取全部的类别作为非结构化数据的多元数据类别; 所述非结构化数据包括文档数据,所述文档数据具有元数据、文本数据和图片三种模态,所述元数据采用RoBERTa语义理解模型表征以获得元数据表征向量;文本数据采用Longformer语义理解模型表征以获得文本数据表征向量;所述图片先采用ViT语义理解模型对每张图片进行表征后,再利用Transformer编码器将所有图片的表征向量进行融合,以获得图片表征向量;将元数据表征向量、文本数据表征向量和图片表征向量在通道维度进行堆叠后输入至卷积神经网络;卷积神经网络的卷积核将三个通道上的元数据表征向量、文本数据表征向量和图片表征向量进行融合,以获得文档数据的融合表征; S5.计算非结构化数据的最大数据级别和期望数据级别;其中,最大数据级别通过如下方法计算: S50.计算多元数据类别中每一类别对应的数据级别向量; S51.从数据级别向量中选择数据级别最大的值作为非结构化数据的最大数据级别; 期望数据级别通过如下方法计算: S52.根据多元数据类别中的每一类别在概率向量中的索引,从M维向量中获取其对应的logits,且进一步的表示为CLogits; S53.将CLogits转换为概率向量CP,根据概率向量CP计算期望数据级别;期望数据级别的计算公式为: , 其中,为期望数据级别;,为非结构化数据的多元数据类别中的第个类别,为非结构化数据的多元数据类别中的类别数;表示的是数据类别的概率,,为非结构化数据的多元数据类别中的第个类别在概率向量P中的索引,是非结构化数据的多元数据类别中的第个类别对应的logit,j是一个变量,表示1,2,3,…,m,是非结构化数据的多元数据类别中的第个类别对应的logit,非结构化数据的相关数据属性为attr,对于一个数据类别,其对应数据级别为,。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军92493部队信息技术中心,其通讯地址为:125001 辽宁省葫芦岛市龙港区海滨南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励