Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学耿卫东获国家专利权

浙江大学耿卫东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利一种从动作视频数据生成细粒度语义描述的方法与装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120747964B

龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511225221.3,技术领域涉及:G06V20/70;该发明授权一种从动作视频数据生成细粒度语义描述的方法与装置是由耿卫东;张毅宁设计研发完成,并于2025-08-29向国家知识产权局提交的专利申请。

一种从动作视频数据生成细粒度语义描述的方法与装置在说明书摘要公布了:本发明提供的从动作视频数据生成细粒度语义描述的方法与装置,基于孤立词手语识别数据集与含词目标注的连续手语识别数据集,建立训练数据集,获得细粒度语义描述建模的动作视频数据和动作描述文本数据,通过包含动作视频特征编码模块、多模态特征融合模块、和文本特征编码模块组成的训练架构,结合用户提示词和系统提示词并引入掩码重建机制,得到细粒度语义动作描述风格预训练生成模型,采用动作视频数据微调并建立损失函数,得到细粒度语义动作描述生成模型,用于生成高质量细粒度语义动作描述数据,缓解当前细粒度语义动作描述数据欠缺的问题。确保在处理如手语视频、交互动作等高动态复杂场景时,生成结果的稳定性和准确性。

本发明授权一种从动作视频数据生成细粒度语义描述的方法与装置在权利要求书中公布了:1.一种从动作视频数据生成细粒度语义描述的方法,其特征在于,包括以下步骤: 基于孤立词手语识别数据集与含词目标注的连续手语识别数据集,建立训练数据集,从训练数据集中分别获得细粒度语义描述建模的动作视频数据和动作描述文本数据; 通过动作视频特征编码模块,从动作视频数据中分别提取出人体姿态特征与动力学特征,再通过多模态特征融合模块对人体姿态特征与动力学特征进行融合,得到动作视频编码特征;同时,通过文本特征编码模块对动作描述文本数据的细粒度语义文本进行文本嵌入得到动作描述文本编码特征; 基于动作视频编码特征和动作描述文本编码特征,设计系统提示词,通过对动作描述文本编码特征掩码操作得到用户提示词,构建由用户提示词、系统提示词和标准回答组成的样本数据,通过接收样本数据为输入,使用预训练的大语言模型预测并重建被掩码的原始内容,得到细粒度语义动作描述风格预训练生成模型; 采用动作视频数据微调细粒度语义动作描述风格预训练生成模型,并建立损失函数进行训练,得到细粒度语义动作描述生成模型,具体包括:基于动作视频数据获得动作视频嵌入,与文本嵌入,通过位置拼接的方式获得细粒度语义动作描述生成模型的输入token序列,通过细粒度语义动作描述风格预训练生成模型预测得到动作描述token序列,并建立损失函数优化细粒度语义动作描述风格预训练生成模型,得到细粒度语义动作描述生成模型;其中,建立的损失函数表示为,计算如下: , 式中,为输入token序列长度,为大语言模型词表大小,表示第位置上词表第个token的真实概率,其中token位置上为1,其余token位置均为0,表示细粒度语义动作描述生成模型预测结果第位置上词表第个token的概率,表示动作视频嵌入的序列长度,表示文本嵌入的序列长度,表示第位置上的文本嵌入; 利用细粒度语义动作描述生成模型,基于输入的动作视频数据推理生成细粒度语义动作描述文本。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。