山东建筑大学郭杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东建筑大学申请的专利一种基于不确定性估计的多模态特征动态融合方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120257217B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510740553.9,技术领域涉及:G06F18/25;该发明授权一种基于不确定性估计的多模态特征动态融合方法及系统是由郭杰;刘越;马玉玲;邱兰婷设计研发完成,并于2025-06-05向国家知识产权局提交的专利申请。
本一种基于不确定性估计的多模态特征动态融合方法及系统在说明书摘要公布了:本发明提出了一种基于不确定性估计的多模态特征动态融合方法及系统,涉及多模态数据处理技术领域;包括获取多模态数据;采用不同预训练模型对各模态数据进行特征提取,分别得到视觉特征向量、音频特征向量与文本特征向量;多模态特征动态融合模型将视觉模态数据输入特征增强模块得到增强后的特征向量;将特征向量、音频特征向量与文本特征向量输入不确定性度量模块计算得到各模态特征向量的不确定性大小,将各模态特征向量与其对应的不确定性大小输入多模态动态融合模块得到多模态特征动态融合结果。解决了现有技术静态权重缺陷和噪声感知缺失问题。
本发明授权一种基于不确定性估计的多模态特征动态融合方法及系统在权利要求书中公布了:1.一种基于不确定性估计的多模态特征动态融合方法,其特征在于,包括: 获取多模态数据,所述多模态数据分别为视觉模态数据、音频模态数据和文本模态数据; 采用不同预训练模型对不同模态数据进行特征提取,分别得到视觉特征向量、音频特征向量与文本特征向量; 将所有特征向量输入训练好的多模态特征动态融合模型,输出最终多模态特征动态融合结果; 其中,所述多模态特征动态融合模型将视觉模态数据输入特征增强模块得到增强后的特征向量; 将所述特征向量、音频特征向量与文本特征向量输入不确定性度量模块计算得到各模态特征向量的不确定性大小,将各模态特征向量与其对应的不确定性大小输入多模态动态融合模块得到多模态特征动态融合结果; 各模态特征向量对应的不确定性大小包括数据不确定性大小和模型不确定性大小; 其中,所述数据不确定性大小预测过程具体为: 输入各模态特征向量,引入含有M个诱导点的集合,其中,MN,N为样本数量; 构建联合高斯分布,包括特征向量之间的核矩阵、特征向量和诱导点之间的核矩阵、以及诱导点之间的核矩阵; 引入变分分布q: 其中,为诱导点处的函数值,为的变分均值,为的变分协方差;为多元高斯分布; 计算预测方差表示数据不确定性: 其中,为核函数对输入的计算结果,为输入的特征向量,∈{1,2,3,…,N}; 所述模型不确定性大小预测过程具体为: 引入变分分布近似神经网络参数的真实后验分布; 进行蒙特卡洛采样,对变分分布进行T次采样,每次采样从变分分布中抽取一组权重参数; 计算第t次采样权重参数的预测概率,t∈[1,T]; 计算所有预测概率的平均值,得到预测均值; 计算预测方差; 模型不确定性定义为协方差矩阵的对角线元素,即“第c类概率”的样本方差,定义为: 其中,定义为模型不确定性,表示对输入的预测概率分布; 为第t次dropout掩码下,对输入数据预测为第c类的概率值;为第c类概率的预测均值; 通过各模态特征向量数据不确定性大小和模型不确定性大小计算各模态特征向量不确定性总量; 其中,为第m种模态的不确定性总量;为第m种模态的数据不确定性大小; 为第m种模态的模型不确定性大小;为超参数用于维持数据稳定; 将各模态特征向量不确定性总量取倒数作为其原始权重; 为第m种模态的初始权重; 对所有模态特征向量的权重进行归一化处理,通过计算各模态特征向量原始权重与所有模态特征向量的权重之比,得到各模态特征向量动态融合时的最终权重; 为第m种模态动态融合时的最终权重; 将最终权重与各模态分类器所得的均值进行加权融合,输出多模态特征动态融合后的结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东建筑大学,其通讯地址为:250000 山东省济南市历城区临港开发区凤鸣路1000号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励