Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东理工大学孙裕健获国家专利权

山东理工大学孙裕健获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东理工大学申请的专利基于对齐步调的异构模型知识传递及多模态情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121278493B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511841018.9,技术领域涉及:G06F18/241;该发明授权基于对齐步调的异构模型知识传递及多模态情感识别方法是由孙裕健;王利生;陈国文;由德方;王绍卿;杨善良设计研发完成,并于2025-12-09向国家知识产权局提交的专利申请。

基于对齐步调的异构模型知识传递及多模态情感识别方法在说明书摘要公布了:本发明属于情感识别技术领域,具体涉及基于对齐步调的异构模型知识传递及多模态情感识别方法,步骤包括:对多模态数据进行预处理,部署异构师生模型集群,对多模态数据进行特征提取,得到教师原始特征向量和学生原始特征向量;对教师原始特征向量和学生原始特征向量分别进行结构化特征对齐处理;构建自适应知识步调模块,为每个模态生成一个步调系数;计算异构师生模型集群中教师模型与学生模型之间的知识传递损失;对学生模型和自适应知识步调模块进行参数优化;基于优化后的异构师生模型集群和自适应知识步调模块,对实际输入的多模态数据进行情感识别。本发明在模型极度轻量化的前提下,能够实现高性能识别。

本发明授权基于对齐步调的异构模型知识传递及多模态情感识别方法在权利要求书中公布了:1.基于对齐步调的异构模型知识传递及多模态情感识别方法,其特征在于包括以下步骤: S1、对多模态数据进行预处理,多模态数据包含音频模态数据、视频模态数据、文本模态数据中的至少两种; S2、部署异构师生模型集群,包括教师模型集群和学生模型集群,利用异构师生模型集群对多模态数据进行特征提取,得到教师原始特征向量和学生原始特征向量; S3、对教师原始特征向量和学生原始特征向量分别进行结构化特征对齐处理,得到对齐后的教师特征向量和学生特征向量; S4、构建自适应知识步调模块,自适应知识步调模块包括一个与各模态对应的可学习参数,通过梯度反转层将可学习参数转换为步调系数,为每个模态生成一个可学习的、动态调整的步调系数; S5、基于步调系数以及对齐后的教师特征向量、学生特征向量,计算异构师生模型集群中教师模型与学生模型之间的知识传递损失; S6、结合知识传递损失以及学生模型的分类任务损失,形成总损失函数,利用总损失函数对学生模型和自适应知识步调模块进行参数优化; S7、基于优化后的异构师生模型集群和自适应知识步调模块,对实际输入的多模态数据进行情感识别; S1中,音频模态数据为原始语音片段,视频模态数据为连续视频,文本模态数据为原始文字,预处理过程为: 将原始语音片段转化为梅尔频谱; 将连续视频拆解为视频切片,并提取视觉特征块,去除无关背景信息; 对原始文字利用BPE分词进行分词-编码处理,得到词嵌入向量; S2中,教师模型集群中包含音频模态教师、视频模态教师和文本模态教师,音频模态教师采用自监督音频Transformer模型,视频模态教师采用视觉Transformer模型,文本模态教师采用优化后的BERT架构模型,其中优化后的BERT架构模型是在原始BERT架构上,通过模型剪枝、知识蒸馏和参数共享进行结构轻量化,并利用情感领域数据进行预训练得到的BERT架构; 学生模型集群中包含音频模态学生、视频模态学生和文本模态学生,音频模态学生采用轻量级语音情感识别卷积网络,视频模态学生采用移动端视觉Transformer架构,文本模态学生采用文本分类卷积神经网络; S3中,基于标准化运算进行结构化特征对齐处理,表示为: ; 式中,表示标准化运算;为任一模型输出的原始特征向量;、分别为该原始特征向量的均值和标准差;为防止分母为0的常数;m为模态索引,包括音频模态、视频模态、文本模态;X为模型类型索引,包括自监督音频Transformer模型、视觉Transformer模型、优化后的BERT架构模型、轻量级语音情感识别卷积网络、移动端视觉Transformer架构、文本分类卷积神经网络; S4中,步调系数表示为: ; 式中,为模态m的步调系数,m为模态索引,包括音频模态、视频模态、文本模态;为与模态m对应的可学习参数,通过随机分布采样生成;表示梯度反转层,为梯度反转层的系数,用于控制梯度反转的强度;为Sigmoid激活函数;、为预设的步调系数的上限、下限。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东理工大学,其通讯地址为:255000 山东省淄博市张店区新村西路266号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。