Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国铁塔股份有限公司;北京大学余家忠获国家专利权

中国铁塔股份有限公司;北京大学余家忠获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国铁塔股份有限公司;北京大学申请的专利基于文本对图像进行检测的方法、装置以及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120125916B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510595768.6,技术领域涉及:G06V10/764;该发明授权基于文本对图像进行检测的方法、装置以及电子设备是由余家忠;刘子伟;靳志娟;施林苏;彭宇新;赵国豪设计研发完成,并于2025-05-09向国家知识产权局提交的专利申请。

基于文本对图像进行检测的方法、装置以及电子设备在说明书摘要公布了:本申请公开了一种基于文本对图像进行检测的方法、装置以及电子设备。其中,该方法包括:获取目标文本和目标图像;将目标文本和目标图像输入至目标模型,其中,目标模型包括编码器、查询模块以及解码器,编码器至少用于对目标图像和目标文本进行特征提取,查询模块至少用于确定提取到的文本特征和图像特征之间的相似度,解码器至少用于基于交叉注意力机制对文本特征和图像特征进行交互;通过目标模型确定检测结果。本申请解决了现有技术中对不同应用场景进行物体检测时,需要针对每个应用场景单独建模所造成的检测成本高、检测效率低的技术问题。

本发明授权基于文本对图像进行检测的方法、装置以及电子设备在权利要求书中公布了:1.一种基于文本对图像进行检测的方法,其特征在于,包括: 获取目标文本和目标图像,其中,所述目标文本用于通过预设语言描述所述目标图像中需要检测的物体,所述目标图像为E个应用场景中的任意一个应用场景对应的场景图像,E为正整数; 将所述目标文本和所述目标图像输入至目标模型,其中,所述目标模型包括编码器、查询模块以及解码器,所述编码器至少用于对所述目标图像和所述目标文本进行特征提取,所述查询模块至少用于确定提取到的文本特征和图像特征之间的相似度,所述解码器至少用于基于交叉注意力机制对所述文本特征和所述图像特征进行交互,所述目标模型的训练样本至少包括Y个开源训练图像、Z个边界框、W个物体类型,以及对E个应用场景对应的历史场景图像进行预处理得到的U个历史训练图像、所述U个历史训练图像中出现的物体类型,Y、Z、W以及U均为正整数;通过所述目标模型确定检测结果,其中,所述检测结果用于表征所述目标文本描述的物体在所述目标图像中的位置; 其中,通过所述目标模型确定检测结果,包括:通过所述目标模型中的编码器确定所述目标文本包括的语义信息和上下文信息,将所述目标文本包括的语义信息和上下文信息作为所述目标文本对应的第一文本特征;通过所述目标模型中的编码器基于多尺度特征融合策略对所述目标图像进行特征提取,得到所述目标图像对应的M个第一图像特征,其中,M为正整数;依据所述第一文本特征和所述M个第一图像特征确定所述检测结果; 其中,依据所述第一文本特征和所述M个第一图像特征确定所述检测结果,包括:将所述第一文本特征和所述M个第一图像特征输入至所述目标模型中的查询模块;通过所述查询模块对所述第一文本特征进行特征增强,得到第二文本特征,对所述M个第一图像特征进行特征增强,得到M个第二图像特征;获取所述M个第二图像特征对应的分数矩阵,其中,所述分数矩阵中的分数用于表征每个第二图像特征与所述第二文本特征之间的相似度;依据所述分数矩阵中的分数对所述M个第二图像特征进行排序,得到图像特征序列;将所述图像特征序列中排名靠前的P个第二图像特征作为P个索引,其中,所述P个索引用于确定所述目标文本描述的物体在所述目标图像中的位置,P为小于或等于M的正整数;依据所述第二文本特征和所述P个索引确定所述检测结果; 其中,依据所述第二文本特征和所述P个索引确定所述检测结果,包括:将所述第二文本特征和所述P个索引输入至所述目标模型中的解码器;通过所述解码器中的文本交叉注意力层对所述第二文本特征进行更新,得到第三文本特征,其中,所述文本交叉注意力层用于对所述第二文本特征进行特征增强;通过所述解码器中的图像交叉注意力层对所述P个索引进行更新,得到P个第三图像特征,其中,所述图像交叉注意力层用于对所述P个索引进行特征增强;依据所述P个第三图像特征中的每个第三图像特征和所述第三文本特征之间的相似度确定所述检测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国铁塔股份有限公司;北京大学,其通讯地址为:100195 北京市海淀区东冉北街9号院北区14号楼-1至3层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。