蓝卓数字科技有限公司褚健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉蓝卓数字科技有限公司申请的专利基于多模态大模型的UI效果图识别方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119206376B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411687205.1,技术领域涉及:G06V10/764;该发明授权基于多模态大模型的UI效果图识别方法、系统及介质是由褚健;陈英杰;刘贤康;李佳鹤设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。
本基于多模态大模型的UI效果图识别方法、系统及介质在说明书摘要公布了:本申请公开了基于多模态大模型的UI效果图识别方法、系统及介质,方法包括如下步骤:基于图像编码、多模态投影以及文本编码构建多模态预训练模型;根据历史图像数据以及多模态预训练模型执行微调训练,获取多模态大模型;基于内置组件数据结构构建向量数据库;获取待识别UI效果图,基于多模态大模型以及待识别UI效果图输出第一识别数据;利用检索算法针对第一识别数据搜寻向量数据库,输出对应待识别UI效果图的生成信息。本申请的有益效果:确保UI效果图生成一致性以及高效性。
本发明授权基于多模态大模型的UI效果图识别方法、系统及介质在权利要求书中公布了:1.基于多模态大模型的UI效果图识别方法,其特征在于:包括如下步骤: 基于图像编码、多模态投影以及文本编码构建多模态预训练模型; 根据历史图像数据以及多模态预训练模型执行微调训练,获取多模态大模型; 基于内置组件数据结构构建向量数据库; 获取待识别UI效果图,基于多模态大模型以及待识别UI效果图输出第一识别数据; 利用检索算法针对第一识别数据搜寻向量数据库,输出对应待识别UI效果图的生成信息; 所述根据历史图像数据以及多模态预训练模型执行微调训练还包括: 获取历史图像数据,识别历史图像数据的关键特征; 若关键特征为基本视觉特征,则以图像编码的初始卷积层作为微调层次; 若关键特征为复杂结构特征,则以图像编码的中间卷积层作为微调层次; 若关键特征为全局语义特征,则以图像编码的顶层卷积层或全连接层作为微调层次; 当以图像编码的中间卷积层作为微调层次时: 利用LoRA根据微调层次调整多模态预训练模型的权重矩阵; 对历史图像数据进行图像编码和文本编码,获取视觉特征与语言特征; 基于交叉注意力模块映射视觉特征与语言特征,计算注意力权重; 基于注意力权重以及门控融合机制获得融合视觉特征; 基于损失函数以及融合视觉特征更新微调参数,执行微调训练; 当以图像编码的顶层卷积层或全连接层作为微调层次时: 利用前缀调优技术更新文本编码的前缀向量参数,执行微调训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人蓝卓数字科技有限公司,其通讯地址为:315012 浙江省宁波市海曙区甬水桥科创中心1号A区6-3,D区6-2;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。