北京科技大学张天翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科技大学申请的专利一种自由文本引导的遥感图像指代分割方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120340034B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510823159.1,技术领域涉及:G06V20/70;该发明授权一种自由文本引导的遥感图像指代分割方法和系统是由张天翔;温兆堃;李江昀;王宏;袁立;庄培显设计研发完成,并于2025-06-19向国家知识产权局提交的专利申请。
本一种自由文本引导的遥感图像指代分割方法和系统在说明书摘要公布了:本发明提供一种自由文本引导的遥感图像指代分割方法和系统,包括:构建包括图像、文本和各种标签的数据样本,输入并训练区域关系驱动图文分割模型,模型包括的动态关联视觉编码器,对图像进行多尺度感知与动态响应增强,生成多尺度视觉特征;像素级解码器,对进行像素级解码输出图像掩码信息;上下文关联文本编码器,对文本进行语义建模生成属性‑对象信息;区域关系建模模块,对和分别进行区域‑视觉和区域‑语言建模交互,得到区域过滤器和区域关联特征;目标导向联合解码器,对、和进行联合解码,实现模型的多头预测输出。本发明可以对遥感图像进行分割。
本发明授权一种自由文本引导的遥感图像指代分割方法和系统在权利要求书中公布了:1.一种自由文本引导的遥感图像指代分割方法,其特征在于,所述方法包括: S1、收集并预处理遥感图像数据; S2、对预处理后的图像数据进行实例级目标掩码标注和其他处理得到各种标签,构造多样化的自然语言描述本文,构建得到包括图像、文本和各种标签的数据样本; S3、将所述数据样本输入并训练区域关系驱动图文分割模型,所述区域关系驱动图文分割模型包括动态关联视觉编码器、像素级解码器、上下文关联文本编码器、区域关系建模模块和目标导向联合解码器模块; 所述动态关联视觉编码器,对输入的图像数据进行多尺度感知与动态响应增强,生成具备空间结构信息的多尺度视觉特征; 所述像素级解码器,对所述多尺度视觉特征进行像素级解码,输出包括图像各类别实例的图像掩码信息; 所述上下文关联文本编码器,对输入的文本进行语义建模,综合提取其中包括的各种关键信息,生成具备上下文结构感知能力的属性-对象信息; 所述区域关系建模模块,对所述和分别进行区域-视觉建模交互和区域-语言建模交互,逐步整合各类语义信息,提升模型对复杂表达的理解与建模能力,得到区域过滤器和区域关联特征; 所述目标导向联合解码器,对所述、和进行联合解码,判断输入文本是否与图像存在真实语义匹配,并进行多目标合并和无目标诊断,实现模型的多头预测输出:目标掩码、区域概率以及目标存在判别; S4、使用训练完成的区域关系驱动图文分割模型,对待分割遥感图像进行分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。