厦门大学纪荣嵘获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种基于主动学习的多模态大模型迁移微调问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121279463B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511838384.9,技术领域涉及:G06N5/04;该发明授权一种基于主动学习的多模态大模型迁移微调问答方法是由纪荣嵘;柯昭熙;周奕毅;吴穹设计研发完成,并于2025-12-08向国家知识产权局提交的专利申请。
本一种基于主动学习的多模态大模型迁移微调问答方法在说明书摘要公布了:本发明公开了一种基于主动学习的多模态大模型迁移微调问答方法,该方法首先通过K‑Means聚类算法对未标注图像数据集进行分组,从各聚类中抽取预设比例样本标注形成初始视觉问答数据集,用于多模态大模型的初步微调;随后基于初级微调多模态大模型,计算未标注图像的不确定性指标,筛选高价值样本进行标注以扩充数据集;最后通过迭代微调优化模型,直至满足预设终止条件,并通过最终迁移的多模态大模型完成领域的视觉问答任务。本发明显著降低了视觉问答任务中的数据标注成本,提升了数据质量与模型领域适配性,高效实现多模态大模型在专业领域的迁移应用。
本发明授权一种基于主动学习的多模态大模型迁移微调问答方法在权利要求书中公布了:1.一种基于主动学习的多模态大模型迁移微调问答方法,其特征在于,包括以下步骤: S1、输入未标注图像数据集,采用K-Means聚类算法对图像进行分组; 步骤S1的具体过程为: S11、输入大小为的未标注图像数据集,使用预训练的多模态大模型的视觉编码器V提取每张未标注图像的图像视觉特征;其中,i为未标注图像的编号,第i张未标注图像表示为,0≤i≤; S12、对于大小为的未标注图像数据集,共有个图像视觉特征,并基于领域知识经验设定聚类数量为k,使用K-Means聚类算法对图像视觉特征进行聚类分组; S13、迭代优化聚类中心直至收敛,输出分组结果,其中,为前k个分组结果; S2、对步骤S1得到的每个聚类中抽取预设比例的图像样本,并标注问题-答案对,形成初始视觉问答数据集; S3、使用步骤S2得到的初始视觉问答数据集对预训练的多模态大模型进行初步微调,获得初级微调多模态大模型; S4、基于步骤S3得到的初级微调多模态大模型,计算未标注图像的不确定性指标;所述不确定性指标为熵值、最小置信度及置信区间归一化值的加权和; S5、针对步骤S1得到的每个聚类,选取步骤S4计算得到的不确定性指标最大的未标注图像进行标注; S6、将步骤S5新标注的视觉问答数据与步骤S2获得的初始视觉问答数据集合并,再对步骤S3得到的初级微调多模态大模型进行二次微调; S7、重复执行步骤S4至步骤S6,直到满足预设的迭代终止条件,获得最终迁移的多模态大模型,并通过最终迁移的多模态大模型完成领域的视觉问答任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励