清华大学陈辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119761519B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411951125.2,技术领域涉及:G06N5/04;该发明授权基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置是由陈辉;孙冯元;王澳;丁贵广设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。
本基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置在说明书摘要公布了:本申请提供了一种基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置,涉及人工智能技术领域,旨在加速多模态大模型的推理速度。该方法包括:将目标图像输入视觉编码器进行多层注意力交互,得到由多个视觉令牌组成的视觉令牌序列,以及多层类令牌对视觉令牌的注意力分数分布;根据所述多层类令牌对视觉令牌的注意力分数分布,确定出类令牌对各个视觉令牌的最终注意力分数,所述最终注意力分数表征视觉令牌的重要度;根据所述类令牌对各个视觉令牌的最终注意力分数,从所述视觉令牌序列中选择出重要度高的多个目标视觉令牌;将所述多个目标视觉令牌和文本提示输入语言模型进行推理,得到推理结果。
本发明授权基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置在权利要求书中公布了:1.一种基于视觉令牌剪枝的多模态大模型无训练推理加速方法,其特征在于,所述方法包括: 将目标图像输入视觉编码器进行多层注意力交互,得到由多个视觉令牌组成的视觉令牌序列,以及多层类令牌对视觉令牌的注意力分数分布;每层注意力交互基于类令牌来整合视觉令牌的全局信息和局部信息,所述类令牌对视觉令牌的注意力分数分布与多模态大模型的视觉令牌注意力分数分布相似; 根据所述多层类令牌对视觉令牌的注意力分数分布,确定出类令牌对各个视觉令牌的最终注意力分数,所述最终注意力分数表征视觉令牌的重要度; 根据所述类令牌对各个视觉令牌的最终注意力分数,从所述视觉令牌序列中选择出重要度高的多个目标视觉令牌; 将所述多个目标视觉令牌和文本提示输入语言模型进行推理,得到推理结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园街道清华大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。