桂林理工大学周国清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林理工大学申请的专利视觉语言模型的遥感影像KNN检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119942343B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510058337.6,技术领域涉及:G06V20/10;该发明授权视觉语言模型的遥感影像KNN检索方法是由周国清;司培文设计研发完成,并于2025-01-14向国家知识产权局提交的专利申请。
本视觉语言模型的遥感影像KNN检索方法在说明书摘要公布了:本发明公开了一种遥感影像在视觉语言模型中的KNN检索方法,包括五个步骤:S1数据预处理:将视觉语言测试数据集中的遥感影像数据集进行base64处理,文本数据集进行jsonl处理,处理后上传至数据库;S2影像文本序列化:对预处理后的数据集进行序列化以方便训练时随机读取;S3CLIP模型训练:将数据序列化后的数据送入视觉语言模型进行训练,得出训练模型;S4图文特征提取:将测试数据通过训练模型进行特征提取;S5KNN检索评估:将特征提取出来的文件进行KNN检索评估。本发明可以通过视觉语言测试数据集对KNN检索进行训练,并进行检索评估,以帮助快速、准确地从海量数据中检索出相关的或相似的内容。
本发明授权视觉语言模型的遥感影像KNN检索方法在权利要求书中公布了:1.一种视觉语言模型的遥感影像KNN检索方法,其特征在于,包括如下步骤: S1:数据预处理; S2:影像文本数据序列化; S3:CLIP大模型训练;所述步骤S3CLIP大模型训练包括: S31:输入遥感影像,将图像切分为固定大小的切块并将图像切块转换为嵌入空间; S32:添加位置编码来显式地引入图块的位置信息; S33:对层归一化后的结果进行多头自注意力机制和前馈神经网络进行处理并引入dropout从而避免产生过拟合或欠拟合; S34:将改进QuickGELU激活MLP,并通过全连接层以及softmax层输出概率分布结果;其中改进QuickGELU激活函数的公式为: 1 其中y表示输出结果,x为输入变量,σ表示Sigmoid函数,即 2 3 4 表示经过动态调整后的参数,其中α是初始化时设定的参数; 步骤S35:通过标准的监督学习方法进行训练并在adam中调整优化; S4:图文特征提取;所述步骤S4图文特征提取处理包括: S41:输入图像经过三个卷积层和一个池化层后,输出一个较低分辨率的特征图,其中卷积层为可变性卷积,其公式为: 5 其中,p是标准卷积中的填充参数,和分别表示输出和输入通道索引,i和j分别表示输出特征图在高度和宽度方向上的位置,是卷积核权重; S42:通过多个Bottleneck残差块,进一步提取更复杂的高级特征; S43:使用自注意力机制来聚合空间信息将特征图变成一个固定长度的向量; S44:输出一个包含高维特征的向量用于进一步的检索任务; S5:KNN检索评估,所述步骤S5KNN检索评估包括: S51:计算特征提取的向量与数据集中的向量的距离; S52:基于groundtruth来判定前K个邻近是否相关; S53:针对其召回率和mean_recall进行评估;对其召回率进行评估具体定义下: 6 7 8 其中R为召回率,TP表示将正类预测为正类数,FN表示将负类预测为负类数,R@kk=1,5,10表示召回点,rk表示返回的前k个图像中相关图像的数量,r表示查询相关的图像总数,MR表示平均召回率;MR分数越高表示检索效果越好。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林理工大学,其通讯地址为:541004 广西壮族自治区桂林市七星区建干路12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励