安徽大学;安徽皖垦种业股份有限公司丁云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学;安徽皖垦种业股份有限公司申请的专利多模态数据蒸馏农业病虫害检测大模型构建方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120654101B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511143472.7,技术领域涉及:G06F18/2415;该发明授权多模态数据蒸馏农业病虫害检测大模型构建方法和系统是由丁云;朱进;侯明扬;陈军;王龙平;张庚生;苏延森;郑春厚设计研发完成,并于2025-08-15向国家知识产权局提交的专利申请。
本多模态数据蒸馏农业病虫害检测大模型构建方法和系统在说明书摘要公布了:本发明公开了多模态数据蒸馏农业病虫害检测大模型构建方法和系统,其中方法包括:预处理获得预保留数据集S1、S11和S12;使用基座大模型将S11区分出能正确回答的数据RS1和不能正确回答的数据IS1,通过大模型打分的方式最终得到预保留数据集S3,将带有长思维链的数据集S1和S12合并,得到预保留数据集S2,基于诚实大模型进行LoRA微调,得到数据蒸馏大模型;确定数据蒸馏大模型的量化参数和量化算法,并进行量化感知训练优化和精度校准,得到量化大模型;对用户输入信息或摄像自动捕捉图像,分别进行标准化处理和二分类判断,得到最终回答。本发明有效解决传统大模型在农业病虫害方面存在的不专业、难部署、幻觉问题。
本发明授权多模态数据蒸馏农业病虫害检测大模型构建方法和系统在权利要求书中公布了:1.多模态数据蒸馏农业病虫害检测大模型构建方法,其特征在于,包括以下步骤: Step1、收集并整理农业病虫害图文配对数据集,预处理获得预保留数据集S1、S11和S12; Step2、使用基座大模型将S11区分出能正确回答的数据RS1和不能正确回答的数据IS1,通过大模型打分的方式最终得到预保留数据集S3,再利用基座大模型对预保留数据集S3进行DPO算法微调,得到具有二分类判断的诚实大模型,同时将带有长思维链的数据集S1和S12合并,得到预保留数据集S2,并基于诚实大模型进行LoRA微调,得到数据蒸馏大模型; Step3、确定数据蒸馏大模型的量化参数和量化算法,并进行量化感知训练优化和精度校准,得到量化大模型; Step4、对用户输入的信息或摄像自动捕捉的图像,分别进行标准化处理,并使用量化大模型进行初步推理,然后进行二分类判断,得到最终的答案; 所述Step2进一步包括: Step21、经由基座大模型对预保留数据集S11进行提问,以确保数据集的质量; Step22、将基座大模型错误回答的问题对应的数据集保存为IS1,并在数据集中加入标签“label”:0,将基座大模型正确回答的问题对应的数据集保存为RS1,并在数据集中加入标签“label”:1,得到一个带有二分类标签的数据集S3,该带有二分类标签的数据集S3使用DPO算法训练一个用于二分类的诚实大模型,以区分基座大模型自身可以回答以及自身无法回答的知识; Step23、将预保留数据集S1和S12合并,形成第二阶段LoRA微调的完整的带有长思维链的农业病虫害图文配对数据集S2; Step24、采用改进的LoRA的低秩适配器微调方法,通过在冻结的诚实大模型的Transformer的注意力层增加一个多头低秩权重矩阵,去适配农业病虫害图文配对数据集的下游任务,将低秩矩阵进行多头分解,每个头专注于学习农业病虫害图文数据中不同维度的特征,以进一步提升低秩矩阵对信息粒度的提取能力; 所述Step22中,DPO算法的损失函数表达式为: 上式中,x是预保留数据集S3的问题输入,exp是指数函数,log是对数函数,ypreferred是RS1,yrejected是IS1,β是使用大模型对预保留数据集S11打分得到的平均分数,在0~10之间,RS1数据得分在5分以上,IS1数据得分在5分以下。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学;安徽皖垦种业股份有限公司,其通讯地址为:230601 安徽省合肥市经开区九龙路111号安徽大学磬苑校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励