浙江工商大学徐国龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工商大学申请的专利基于异构数据融合与记忆增强的零样本分割方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121305086B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511823419.1,技术领域涉及:G06V10/26;该发明授权基于异构数据融合与记忆增强的零样本分割方法及系统是由徐国龙;田彦;刘宝龙;何超杰设计研发完成,并于2025-12-05向国家知识产权局提交的专利申请。
本基于异构数据融合与记忆增强的零样本分割方法及系统在说明书摘要公布了:本发明公开了一种基于异构数据融合与记忆增强的零样本分割方法及系统。该方法构建了一个基于SAM2架构的零样本分割模型,通过在SAM2的编码器部分引入多模态特征交互模块,有效整合了不同分辨率和模态的数据;该模块利用改进的注意力机制,在非重叠子图像与原始低分辨率深度法向图像之间进行细粒度信息交互,避免了直接线性融合带来的细节丢失和噪声引入问题。本发明改进了SAM2的记忆机制,将多模态数据视为模态序列,通过记忆编码器和记忆注意力模块捕捉跨模态的共性特征,增强了模型对未知类别的识别能力和场景理解的鲁棒性;该记忆机制通过整合前一模态的特征信息,逐步优化当前模态的分割结果,实现了模态间知识的有效传递与融合。
本发明授权基于异构数据融合与记忆增强的零样本分割方法及系统在权利要求书中公布了:1.一种基于异构数据融合与记忆增强的零样本分割方法,其特征在于,该方法包括: 构建基于SAM2架构的零样本分割模型,所述零样本分割模型包括编码器部分和记忆机制部分;在编码器部分的每个Transformer层的第一归一化层之前插入多模态特征交互模块; 接收RGB图像、深度图像和由深度图像生成的法向图像作为模型输入; 在编码器部分,通过多模态特征交互模块处理不同分辨率的多模态数据,生成层次化特征表示,具体为:将RGB图像分割为多个非重叠子图像,与深度和法向图像组合形成统一输入;降低特征维度后,利用三维深度可分离卷积和跨模态增强策略融合特征,再重组特征并恢复至原始维度;所述编码器部分生成的层次化特征表示F包括、和,其中为第n-2个Transformer层输出的特征,分别为第n-1个Transformer层和第n个Transformer层输出的特征,n为Transformer层的总数; 在记忆机制部分,将多模态数据视为模态序列,利用记忆机制捕获跨模态的模态无关特征,具体为:获得对应的视觉特征、深度特征、法向特征,对应的视觉特征、深度特征、法向特征,对应的视觉特征、深度特征、法向特征;在记忆机制部分,执行三轮操作: 在第一轮中,将视觉特征输入掩码解码器得到视觉掩码,将输入记忆编码器得到视觉特征和相应位置编码; 在第二轮中,令汇聚特征,相应位置编码,将和输入记忆注意力模块计算环境特征,将输入掩码解码器得到深度掩码,将输入记忆编码器得到深度特征和相应位置编码; 在第三轮中,令汇聚特征,相应位置编码,将和输入记忆注意力模块计算环境特征,将输入掩码解码器得到法向掩码,将输入记忆编码器得到法向特征和相应位置编码; 输出分割结果:综合所有模态的分割掩码,通过掩码平均操作生成最终的分割结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工商大学,其通讯地址为:310018 浙江省杭州市西湖区教工路149号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励