电子科技大学宾燚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于多模态大模型的艺术绘画分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119580055B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410941788.X,技术领域涉及:G06V10/82;该发明授权一种基于多模态大模型的艺术绘画分析方法是由宾燚;杨阳;史文浩;廖俊荣;李伟涵设计研发完成,并于2024-07-15向国家知识产权局提交的专利申请。
本一种基于多模态大模型的艺术绘画分析方法在说明书摘要公布了:本发明公开了一种基于多模态大模型的艺术绘画分析方法,首先从艺术绘画库获取图像,使用一个闭源大语言模型筛选出同时具有标题和艺术家姓名的图像,然后,标注对应的仅关注视觉特征的整体艺术分析段落,并对专业层面如构图、颜色、光影等进行艺术分析的标注,从而构成艺术绘画分析数据。利用收集到的艺术绘画分析数据,训练微调一个多模态大模型,得到艺术绘画生成式预训练模型,用于艺术绘画分析的生成。通过实验研究,本发明显著提高了多模态大模型的艺术绘画分析能力。
本发明授权一种基于多模态大模型的艺术绘画分析方法在权利要求书中公布了:1.一种基于多模态大模型的艺术绘画分析方法,其特征在于,包括以下步骤:1、艺术绘画分析的数据收集1.1、从艺术绘画库获取图像,使用一个闭源大语言模型判断是否同时知道该图像即艺术绘画的标题和艺术家姓名,如果知道,则保留,否则丢弃;1.2、使用两个闭源大语言模型分别通过艺术绘画的标题和艺术家姓名检索出已学知识,删除艺术绘画的标题和艺术家姓名,各生成一段只关注视觉特征的分析文本;1.3、从生成的两段只关注视觉特征的分析文本中提取出整体艺术分析段落,并进行分析标注,得到对应的命令文本,从生成的两段只关注视觉特征的分析文本中分别提取出最重要的5个专业层面分析段落,选定5个专业层面分析段落的交集作为选定专业层面分析段落,并进行分析标注,得到选定专业层面的命令文本,这样获得艺术绘画的图像、整体分析段落及对应的命令文本、各专业层面分析段落及对应的命令文本组成的高质量的艺术绘画分析数据,其中,所述的专业层面包括构图、光影、色彩、形状、纹理、象征与图标、透视、运动与姿态、线条质量、尺度比例;2、训练得到艺术绘画生成式预训练模型2.1、构建一个由视觉编码器、多模态投影器以及一个大语言模型组成的多模态大模型,视觉编码器对艺术绘画的图像进行编码,得到视觉特征,多模态投影器使用一个多层感知器将视觉特征投影到语言的语义空间,大语言模型结合命令文本对投影到语言语义空间的视觉特征进行解码,得到整体分析段落或专业层面分析段落;2.2、利用收集的艺术绘画图像与相应的艺术绘画分析数据对多模态大模型进行有监督微调:冻结视觉编码器的参数,对多模态投影器和大语言模型进行微调,训练微调的学习率设置为2e-5,批量大小设置为16,进行10k步微调得到艺术绘画生成式预训练模型;3、推理输入一幅艺术绘画图像I,包含n个单词的指示模型进行分析的命令文本P,通过艺术绘画生成式预训练模型输出包含m个单词的分析段落Output。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。