Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学张立和获国家专利权

大连理工大学张立和获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学申请的专利一种交织编码的指示性分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115861345B

龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211684775.6,技术领域涉及:G06T7/11;该发明授权一种交织编码的指示性分割方法是由张立和;李明慧;卢湖川设计研发完成,并于2022-12-27向国家知识产权局提交的专利申请。

一种交织编码的指示性分割方法在说明书摘要公布了:本发明属于人工智能技术领域,提出了一种交织编码的指示性分割方法。本发明首先分别构建了图像特征提取网络和语言特征提取网络,然后使用了跨模态特征融合模块建立两个特征提取网络之间的联系,同时引入采样方法,抑制背景噪声的产生。再通过图像和语言门控模块控制融合后的特征流入原有编码分支的比例。最后将交织编码得到的融合特征通过解码器上采样输出图像分割结果。本发明实现了高精度轻量级的自然语言指示的图像分割模型,模型充分利用多层级的语言和图像特征,能够有效的定位到语言指示的图像目标,且分割过程快速而精确。

本发明授权一种交织编码的指示性分割方法在权利要求书中公布了:1.一种交织编码的指示性分割方法,其特征在于,具体包括步骤如下: 步骤1、构建图像特征提取网络; 采用ResNeSt-50或ResNeSt-101网络结构作为骨干网络建立图像特征提取网络,用于提取图像特征;分别从ResNeSt-50或ResNeSt-101的其中三层网络中提取输入图像尺寸的对应比例特征作为输出的图像特征 步骤2、构建语言特征提取网络; 采用Bert模型的12层网络结构作为骨干网络构建语言特征提取网络,用于提取自然语言特征;分别从Bert网络中多层网络层提取多层自然语言特征输出 步骤3、构建图像到语言跨模态特征融合模块; 跨模态特征融合模块用于定位到自然语言指示的图像区域;首先,将图像特征Vi和自然语言特征Lj通过2D卷积进行通道降维到同一维度,并作为图像到语言跨模态特征融合模块的输入,图像特征Vi和自然语言特征Lj尺寸分别为C×H×W和C×T;其中H,W和C分别表示图像特征Vi的高、宽以及通道数,T表示自然语言特征Lj中句子的长度;将图像特征Vi重组为尺寸为C×HW的2D矩阵的形式,并计算图像特征Vi和自然语言特征Lj的图像到语言的亲和力矩阵;其中和是可学习的卷积参数; 得到亲和力矩阵运算过程定义如下: 计算得到A′vl∈RHW×T描述了图像特征Vi的每个像素和自然语言特征Lj的每个单词之间的相似性; 对A′vl进行采样操作,沿着H×W维度进行采样,选取沿着H×W的前K个最大值,K为采样点数,其余的值置为零,用于抑制背景像素的干扰,减少亲和矩阵的噪声; Avl″=SamplingAvl′ 采用Softmax函数沿着第一个维度归一化采样后的亲和力矩阵;最后用Avl将图像特征Vi投影到语言空间,获得融合的语言特征L′j尺寸为C×T;运算过程定义如下: Avl=SoftmaxAvl″ L′j=ViAvl 步骤4、构建语言到图像跨模态特征融合模块;首先将自然语言特征Lj和图像特征Vi特征通过卷积进行通道降维至同一通道数,输入至语言到图像跨模态特征融合模块,将两个输入的特征相乘得到语言到图像的亲和矩阵Alv′;其中,和是可学习的参数;对亲和矩阵Alv′进行采样操作,沿着T维度进行采样,选取沿着T的前K个最大的单词,K为采样点数,其余的值置为零,用于突出关键词;运算过程定义如下: Alv″=SamplingAlv′ Alv″∈RHW×T最后通过一个Softmax函数,将自然语言特征Lj映射至图像空间获得融合的图像特征Vi′;运算过程定义如下: Alv=SoftmaxAlv″ Vi′=LAlv 步骤5、构建图像门控模块 图像门控模块用于控制流入图像特征提取网络融合的图像特征的比例;将融合的图像特征Vi′经过图像门控模块与原始图像特征相加,最后再通过卷积进行升维,送入下一层的图像特征提取网络中;图像门控模块具体运算过程设计如下: G1=PSConvCatVi,Vi′ Vi″=NormVi+NormG1·Vi′ 其中,Cat·代表沿着通道维度级联,Conv·代表卷积层,S·代表元素级别的Sigmoid操作,P·代表着是全局平均池化操作;Norm用于表示基于L2范数的归一化; 步骤6、构建语言门控模块 语言门控模块用于控制流入语言特征提取网络融合的语言特征的比例;将融合的语言特征L′j经过语言特征门控模块与语言的原始特征相加,最后再通过卷积进行升维,送入下一层的语言特征提取网络中;其具体运算过程设计如下: G2=PSConvCatLj,Lj′ Lj″=Lj+LNG2·L′j 其中,LN·代表LayerNorm操作; 步骤7、构建整体网络结构 输入图像和一个自然语言的短句;将图像送入图像特征提取网络提取多尺度图像特征;将自然语言的短句送入语言特征提取网络提取多尺度自然语言特征;将提取得到的图像特征和自然语言语言特征分别通过语言到图像跨模态特征融合模块和图像到语言跨模态特征融合模块生成融合特征的图像和融合的语言特征,将融合的图像特征通过图像特征门控模块送回原有的图像特征提取网络;将融合的语言特征通过语言门控模块送回原有的自然语言特征提取网络;最后将图像特征提取网络最深层的融合的图像特征通过上采样输出分割结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。