重庆大学黄智勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利基于不确定性估计的多模态状态空间集成的图像分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119624982B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411847031.0,技术领域涉及:G06T7/10;该发明授权基于不确定性估计的多模态状态空间集成的图像分割方法是由黄智勇;侯明阳;钟代笛;仲元红;韩术;虞智;苗帅;王世伟;李虓宇;刘语诗设计研发完成,并于2024-12-16向国家知识产权局提交的专利申请。
本基于不确定性估计的多模态状态空间集成的图像分割方法在说明书摘要公布了:本发明公开了一种基于不确定性估计的多模态状态空间集成的图像分割方法,该方法包括:获取图像数据和图像数据对应的文本数据;利用CLV‑SSIF模型,根据图像数据和文本数据,对图像进行分割,其中,CLV‑SSIF模型包含多模态空间集成组件和多专家不确定性优化组件,多模态空间集成组件包括图像编码器、文本编码器以及多模态交互式引导解码器;多专家不确定性优化组件用于利用多专家混合模型,生成对图像的初始分割结果并生成专家不确定估计,然后根据专家不确定估计,对初始分割结果进行优化。本发明的方法提升了图像分割的准确度。
本发明授权基于不确定性估计的多模态状态空间集成的图像分割方法在权利要求书中公布了:1.一种基于不确定性估计的多模态状态空间集成的图像分割方法,其特征在于,包括: 获取图像数据和图像数据对应的文本数据; 利用CLV-SSIF模型,根据图像数据和文本数据,对图像进行分割,其中,CLV-SSIF模型包含多模态空间集成组件和多专家不确定性优化组件, 多模态空间集成组件包括图像编码器、文本编码器以及多模态交互式引导解码器, 图像编码器,用于接收图像数据并生成图像特征; 文本编码器,用于接收文本特征并生成文本特征; 多模态交互式引导解码器,用于对图像特征和文本特征进行集成,生成多模态特征; 多专家不确定性优化组件包括初始分割模块、不确定性估计模块和分割优化模块, 初始分割模块,用于利用多专家混合模型,生成对图像的初始分割结果; 不确定性估计模块,用于生成专家不确定估计; 分割优化模块,用于根据专家不确定估计,对初始分割结果进行优化; 所述多专家混合模型包括多个专家模型和门控网络,初始分割模块利用多专家混合模型,生成对图像的初始分割结果具体包括: 在接收了多模态特征之后,每个专家模型产生一个第一输出; 每个第一输出与门控网络进行加权,得到对应于每个专家模型的第二输出; 第二输出与可学习的混合权重进行加权,得到多专家混合模型的混合输出,即初始分割结果; 所述不确定性估计模块生成专家不确定估计具体包括: 根据每个专家模型的第二输出和多专家混合模型的混合输出,进行Choquet模糊积分计算,得到掩膜; 根据初始分割结果,确定图像中掩膜区域的面积和边界框区域的面积; 根据掩膜区域的面积和边界框区域的面积,计算阈值; 利用阈值,将掩膜转换为二进制掩膜,从而得到专家不确定性估计; 所述分割优化模块根据专家不确定估计,对初始分割结果进行优化具体包括: 根据二进制掩膜,计算前景平均值和背景平均值; 设置精细化参数,根据精细化参数、二进制掩膜以及多专家混合模型的混合输出,确定精细化预测掩膜; 根据前景平均值和背景平均值与混合输出的关系,确定最终的预测掩膜,实现分割优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。