中山大学王可泽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利具有注意力机制的扩散模型手势生成方法、系统、可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118192797B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410197919.8,技术领域涉及:G06F3/01;该发明授权具有注意力机制的扩散模型手势生成方法、系统、可读存储介质是由王可泽;李玲玲;李炜聪;丁麒源;唐承佩设计研发完成,并于2024-02-22向国家知识产权局提交的专利申请。
本具有注意力机制的扩散模型手势生成方法、系统、可读存储介质在说明书摘要公布了:本发明涉及计算机技术和人工智能领域,公开了具有注意力机制的扩散模型手势生成方法、系统、可读存储介质,包括以下具体步骤:构建包括编码器、基于注意力的融合网络的条件嵌入模型;将多模态数据输入条件嵌入模型;通过编码器获取多模态数据的综合特征;融合综合特征并通过基于注意力的融合网络构建手势生成框架;构建基于潜在扩散模型的去噪模型,所述的去噪模型包括自注意力网络;将手势生成框架输入去噪模型;在去噪模型中提取条件信息并生成初始潜在手势序列,后根据条件信息,对初始潜在手势序列进行正向扩散和反向扩散,生成最终手势序列。本发明解决了现有技术对特征的多样性和保真度有限的问题,且具有生成效率及质量高的特点。
本发明授权具有注意力机制的扩散模型手势生成方法、系统、可读存储介质在权利要求书中公布了:1.具有注意力机制的扩散模型手势生成方法,其特征在于:包括以下具体步骤: 构建包括编码器、基于注意力的融合网络的条件嵌入模型; 获取包括音频、文本、说话人ID和情感信息的多模态数据,并将多模态数据输入条件嵌入模型;在条件嵌入模型中,通过编码器获取多模态数据的综合特征;融合综合特征并通过基于注意力的融合网络构建手势生成框架; 构建基于潜在扩散模型的去噪模型,所述的去噪模型包括自注意力网络; 初始化种子姿势数据集;将种子姿势数据集及手势生成框架输入去噪模型; 在去噪模型中,将种子姿势数据集结合手势生成框架输入自注意力网络中提取条件信息并生成初始潜在手势序列,根据条件信息,对初始潜在手势序列进行正向扩散和反向扩散,生成最终手势序列; 所述的基于潜在扩散模型的去噪模型,具体为: 其中,表示提取的条件信息;所述的去噪模型用于最小化预测噪声与真实噪声之间的均方误差损失; 将种子姿势数据集结合手势生成框架输入自注意力网络中提取条件信息并生成初始潜在手势序列,具体步骤为: 通过采样算法将种子姿势数据集与手势生成框架连接得到初始潜在手势序列; 将初始潜在手势序列输入自注意力网络中提取条件信息; 根据条件信息,对初始潜在手势序列进行正向扩散和反向扩散,生成最终手势序列,具体步骤为: 基于条件信息,对种子姿势数据集的潜在手势序列进行t轮扩散得到,∈[,],是最大扩散步数,在扩散过程逐步添加高斯噪声,以逼近正态分布: 其中,为基于设定的方差计划,为设定的单位矩阵;通过t轮的扩散步骤实现对手势生成框架进行正向扩散; 基于条件信息,从开始逐个预测并去除中的噪声,直到得到去噪后的,将去噪后的作为生成的最终手势序列,完成负向扩散。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励