Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 苏州大学洪岩获国家专利权

苏州大学洪岩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉苏州大学申请的专利基于多模态信息层级语义建模的服装属性识别方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121708402B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610194497.8,技术领域涉及:G06V10/764;该发明授权基于多模态信息层级语义建模的服装属性识别方法与系统是由洪岩;周奕涵设计研发完成,并于2026-02-11向国家知识产权局提交的专利申请。

基于多模态信息层级语义建模的服装属性识别方法与系统在说明书摘要公布了:本发明涉及服装属性识别技术领域,尤其是指一种基于多模态信息层级语义建模的服装属性识别方法及系统,从服装属性的语义结构出发,合理构建不同层级属性的建模方式,明确图像与文本模态在各属性层级中的主从关系,并通过自适应融合机制提升弱监督条件下模型学习的稳定性与可靠性,从而有效克服现有技术在语义一致性、多模态融合效率以及自训练噪声控制方面的不足,为复杂服装属性识别提供了一种更加适用于实际应用场景的技术方案。

本发明授权基于多模态信息层级语义建模的服装属性识别方法与系统在权利要求书中公布了:1.一种基于多模态信息层级语义建模的服装属性识别方法,其特征在于,包括: 构建多模态属性识别模型,包括特征提取器和分类器;所述特征提取器包括视觉特征提取器和文本特征提取器;所述分类器采用协同决策机制,包括视觉分类器、文本分类器和融合分类器; 将包含原始图像和文本描述的服装样本输入特征提取器,得到多层级视觉特征和多层级文本特征; 将对应层级的视觉特征和文本特征映射至统一特征空间,得到多层级对齐视觉特征和多层级对齐文本特征; 对服装样本进行噪声增强后输入特征提取器,得到多层级增强视觉特征和多层级增强文本特征; 基于对应层级的视觉特征和增强视觉特征、对应层级的文本特征和增强文本特征构建各层级的模态内对比损失,其中包括: 对所有层级,基于对应层级的视觉特征和增强视觉特征构建视觉模态各层级的模态内对比损失,公式为: ; 对于中层和高层,基于对应层级的文本特征和增强文本特征建文本模态各层级的模态内对比损失,公式为: ; 其中,为视觉模态第k个层级的模态内对比损失,为训练样本的批次总数,k为层级索引,i和j均为样本索引,为第i个样本的第k个层级的视觉特征,和分别为第i个样本和第j个样本的第k个层级的增强视觉特征,为余弦相似度函数,为温度系数,为文本模态第k个层级的模态内对比损失,为第i个样本的第k个层级的文本特征,和分别为第i个样本和第j个样本的第k个层级的增强文本特征; 基于多层级对齐视觉特征和多层级对齐文本特征构建各层级的跨模态对比损失;基于相邻层级的对齐视觉特征、相邻层级的对齐文本特征构建各层级的层级一致性损失; 基于各层级的模态内对比损失、跨模态对比损失和层级一致性损失,以及分类损失构建总损失函数; 基于总损失函数,利用带标注的服装样本训练多模态属性识别模型,得到初始多模态属性识别模型; 利用初始多模态属性识别模型,获取未标注的服装样本的伪标签;将带伪标签的服装样本和带标注的服装样本合并为自训练集,对初始多模态属性识别模型再次进行训练,得到完成训练的多模态属性识别模型; 利用完成训练的多模态属性识别模型,获取待识别的服装样本的预测分类标签,其中包括: 将包含原始图像和文本描述的服装样本输入特征提取器,得到多层级视觉特征和多层级文本特征; 将对应层级的视觉特征和文本特征融合后,得到多层级融合特征; 将多层级视觉特征、文本特征和融合特征输入分类器,分别经过视觉分类器、文本分类器和融合分类器,得到各层级的视觉预测类别概率、文本预测类别概率和融合预测类别概率;再利用协同决策机制,得到各层级的预测分类标签;其中将多层级视觉特征、文本特征和融合特征输入分类器,分别经过视觉分类器、文本分类器和融合分类器之前,引入文本信息判定机制,包括: 对于中层和高层,分别计算对应层级的对齐视觉特征和对齐文本特征之间的相似度; 若当前层级的相似度大于等于预设阈值,则将当前层级的视觉特征、文本特征和融合特征分别经过视觉分类器、文本分类器和融合分类器,得到当前层级的视觉预测类别概率、文本预测类别概率和融合预测类别概率;再利用协同决策机制,得到各层级的预测分类标签; 若当前层级的相似度小于预设阈值,则将当前层级的视觉特征经过视觉分类器,得到当前层级的视觉预测类别概率;基于当前层级的视觉预测类别概率得到当前层级的预测分类标签。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215299 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。