哈尔滨工业大学(威海);长江时代通信股份有限公司丁建睿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(威海);长江时代通信股份有限公司申请的专利基于多尺度编解码器的多模态视频序列分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120510545B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510558541.4,技术领域涉及:G06V20/40;该发明授权基于多尺度编解码器的多模态视频序列分割方法是由丁建睿;张听;丁卓设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。
本基于多尺度编解码器的多模态视频序列分割方法在说明书摘要公布了:本发明公开了一种基于多尺度编解码器的多模态视频序列分割方法,步骤包括:提取图像特征和文本特征;获取同时包含图像与语言语义信息的联合特征表示;提取出在不同空间分辨率下的多尺度融合特征序列;得到时空建模后的特征表示序列;得到统一语义空间下的跨尺度融合特征表示;得到前景特征;对分割掩码进行视觉可视化生成语义分割图。该多模态视频序列分割方法能够实现图像和语言语义的深度交互,建立上下文和语义关系,通过多模态协同机制引入跨模态信息交互,增强模型在复杂动态场景中的鲁棒性与稳定性,有效提升图像序列分割模型在分割任务中的分割效果和泛化能力。
本发明授权基于多尺度编解码器的多模态视频序列分割方法在权利要求书中公布了:1.基于多尺度编解码器的多模态视频序列分割方法,其特征在于,包括如下步骤: 步骤1,将图像序列以及对应的文本描述分别输入到图像特征提取器以及文本特征提取器中,提取对应的图像特征和文本特征; 步骤2,将图像特征和文本特征输入到多模态特征融合模块中,获取同时包含图像与语言语义信息的联合特征表示; 步骤3,将联合特征表示送入多尺度特征提取器中,提取出在不同空间分辨率下的多尺度融合特征序列; 步骤4,将多尺度融合特征序列分别输入到多个基于状态空间建模的尺度内编码器中,得到时空建模后的特征表示序列; 步骤5,将特征表示序列输入到尺度间编码器中,捕捉从全局到局部以及从粗糙到精细的语义层级关系,得到统一语义空间下的跨尺度融合特征表示; 步骤6,将跨尺度融合特征表示输入到基于特征金字塔和自适应查询模块构建的多尺度解码器中,得到前景特征; 步骤7,将前景特征输入基于卷积神经网络的轻量级的解码头预测分割掩码,并对分割掩码进行视觉可视化生成语义分割图; 步骤6中,得到前景特征的具体步骤为: 步骤6.1,将跨尺度融合特征表示输入特征金字塔,将粗尺度的跨尺度融合特征表示的语义传播至更细尺度,得到多尺度特征序列; 步骤6.2,随机初始化自适应查询模块的输入特征,使用Transformer解码块从多尺度特征序列联合学习,通过多尺度从粗到精进行处理学习,获得改进的输出特征; 步骤6.3,使用交叉注意块来建立改进的输出特征与多尺度特征序列中最细尺度特征之间的亲和性,从而计算生成最终的前景特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(威海);长江时代通信股份有限公司,其通讯地址为:264299 山东省威海市文化西路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励