Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学赵翔获国家专利权

中国人民解放军国防科技大学赵翔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学申请的专利基于跨模态交互联合检测器的人物图像表情标记方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119740065B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411606615.9,技术领域涉及:G06F18/24;该发明授权基于跨模态交互联合检测器的人物图像表情标记方法是由赵翔;段钰潇;郭浩;徐浩;曾维新;王吉;吴继冰设计研发完成,并于2024-11-12向国家知识产权局提交的专利申请。

基于跨模态交互联合检测器的人物图像表情标记方法在说明书摘要公布了:本发明公开了基于跨模态交互联合检测器的人物图像表情标记方法,包括以下步骤:获取包含人物的图像;提取图像的人物和相关背景知识,并应用文本分类器预测和标记正面情感或负面情感概率;捕捉对象和伴随文本之间的相互作用:通过提取物体和文本的空间坐标,计算相对距离作为注意力权重,建立基于注意力的多模态融合机制,整合多模态信息并将其输入检测机;计算文本的情感得分,并将该得分直接贡献给检测器;根据得分,对图像中人物的情感进行分类和标记。本申请生成对图像中人物情感的全面描述,以及特定领域的背景知识和详细信息;结合注意机制构建对象和文本的跨模态交互融合特征。

本发明授权基于跨模态交互联合检测器的人物图像表情标记方法在权利要求书中公布了:1.基于跨模态交互联合检测器的人物图像表情标记方法,其特征在于,包括以下步骤: 获取包含人物的图像; 提取图像的人物和相关背景知识,并应用文本分类器预测和标记正面情感或负面情感概率; 捕捉对象和伴随文本之间的相互作用:通过提取物体和文本的空间坐标,计算相对距离作为注意力权重,建立基于注意力的多模态融合机制,整合多模态信息并将其输入检测机; 计算文本的情感得分,并将该得分直接贡献给检测器; 根据得分,对图像中人物的情感进行分类和标记; 其中,为了挖掘图像和文本模态之间的相互作用,从提取对象及其空间坐标开始,计算对象-文本距离,将该距离用作注意力权重,并构建基于注意力的多模态融合机制,这个过程产生一个多模态特征表示,然后输入到检测器来预测负面情感的概率; 为了提取文本特征,首先使用PaddleOCR提取文本及其空间坐标,随后使用BERT对文本进行编码;在输入到BERT之前,每个文本块的文本内容都经过预处理,以符合BERT的输入格式要求: 其中,表示每个文本特征的编码,n表示文本块的数量,所有的文本特征被连接起来以构建综合文本特征表示T: 根据图像特征,使用YOLOv8进行目标检测;为了避免图像特征的冗余,在编码图像特征之前提取对象,并省略对象框外的内容,然后VGG19用于编码图像对象; 在本地构建一个预先训练好的YOLOv8模型,将每个图像输入到这个模型中,该模型对输入图像执行对象检测,产生边界框和类别每个对象的标签,所述边界框封装了对象的位置和大小信息,而类别标签指示每个对象的类别以及预测的概率; 基于在检测阶段获得的目标信息,从原始图像中提取目标:对于每个物体,在其包围盒中切出图像区域,然后将其作为VGG19模型的输入进行编码,得到若干维的特征向量; 其中表示每个对象特征的编码,m表示物体的数量;图像的最终对象特征编码通过连接所有对象特征获得的: 采用注意力机制来进行多模态融合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。