中国科学院上海微系统与信息技术研究所李嘉茂获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院上海微系统与信息技术研究所申请的专利一种双向域弥合的行为识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119920000B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411961209.4,技术领域涉及:G06V40/20;该发明授权一种双向域弥合的行为识别方法是由李嘉茂;孙龙娟;徐稀侠;朱冬晨;王磊设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种双向域弥合的行为识别方法在说明书摘要公布了:本发明涉及一种双向域弥合的行为识别方法,包括:获取待识别RGB图像帧序列及其类别文本;将所述待识别RGB图像帧序列输入文本提示生成模块得到生成式文本;将所述待识别RGB图像帧序列及其类别文本和所述生成式文本输入行为识别模型,得到所述待识别视频的动作类别,所述行为识别模型包括:第一文本编码器模块、图像编码器模块、时序编码器模块、第二文本编码器模块、交互模块、融合模块和相似度计算模块。本发明能够有效缩小预训练模型与行为识别任务之间的域差距,从而显著提升CLIP模型在行为识别领域的适用性和性能。
本发明授权一种双向域弥合的行为识别方法在权利要求书中公布了:1.一种双向域弥合的行为识别方法,其特征在于,包括以下步骤: 获取待识别RGB图像帧序列及其类别文本; 将所述待识别RGB图像帧序列输入文本提示生成模块得到生成式文本; 将所述待识别RGB图像帧序列及其类别文本和所述生成式文本输入行为识别模型,得到所述待识别RGB图像帧序列的动作类别,所述行为识别模型包括: 第一文本编码器模块,用于对所述生成式文本进行编码,得到生成式文本特征; 图像编码器模块,用于根据所述待识别RGB图像帧序列生成第一图像特征; 时序编码器模块,集成有运动提示生成模块,用于在所述运动提示生成模块的指导下根据所述待识别RGB图像帧序列生成第二图像特征;其中,所述运动提示生成模块对于所述时序编码器的每一层输入图像嵌入特征,将相邻帧的图像嵌入特征进行拼接,得到成对的帧特征,使用卷积模块提取成对的帧特征的相似性,得到相似性特征,对相似性特征通过权重提取进行降维,获得相似性特征的权重,使用相似性特征的权重加权所述图像嵌入特征,得到各RGB图像帧的运动主体总结,将各帧运动主体总结通过一维卷积模块进行交互,得到RGB图像帧的运动主体提示; 第二文本编码器模块,用于对所述类别文本进行编码,得到类别文本特征; 交互模块,用于对所述生成式文本特征和第一图像特征进行编码,得到引入文本模态信息的更具有区分性的图像特征; 融合模块,用于将所述更具有区分性的图像特征与所述第二图像特征进行融合,得到融合特征; 相似度计算模块,用于计算类别文本特征与所述融合特征的相似度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院上海微系统与信息技术研究所,其通讯地址为:200050 上海市长宁区长宁路865号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励