华南理工大学刘荣辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利工业图像自动标注方法、装置、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120997834B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511525912.5,技术领域涉及:G06V20/70;该发明授权工业图像自动标注方法、装置、设备和存储介质是由刘荣辉;崔巍;邓文锋;汪浩;高存年设计研发完成,并于2025-10-24向国家知识产权局提交的专利申请。
本工业图像自动标注方法、装置、设备和存储介质在说明书摘要公布了:本申请实施例提供工业图像自动标注方法、装置、设备和存储介质,涉及人工智能技术领域。该方法获取待标注图像,将待标注图像输入视觉编码器进行特征编码得到图像特征,获取与工业图像相关的领域术语集合,根据初始噪声向量得到查询向量,根据图像特征得到键向量和值向量,将查询向量、键向量、值向量输入扩散模型,以领域术语集合作为约束条件进行多个时间步的迭代特征处理,得到文本潜向量,将文本潜向量和领域术语集合输入文本解码器进行解码,得到待标注图像对应的图像标注文本。在标注生成全过程都利用领域术语集合作为约束引导,确保标注文本始终围绕具体的工业场景展开,能够显著提高工业图像标注的准确性与规范性。
本发明授权工业图像自动标注方法、装置、设备和存储介质在权利要求书中公布了:1.一种工业图像自动标注方法,其特征在于,包括: 获取待标注图像,将所述待标注图像输入视觉编码器进行特征编码,得到图像特征; 获取与所述工业图像相关的领域术语集合,所述领域术语集合中词语至少包括领域词和通用词,获取初始噪声向量,根据所述初始噪声向量得到查询向量,根据所述图像特征得到键向量和值向量,将所述查询向量、所述键向量、所述值向量输入扩散模型,生成所述领域术语集合对应的术语嵌入序列,根据所述术语嵌入序列生成术语键向量和术语值向量;获取当前时间步对应的所述查询向量,对所述查询向量与所述键向量、所述值向量进行交叉注意力计算得到图像上下文向量,对所述查询向量与所述术语键向量、所述术语值向量进行交叉注意力计算得到术语上下文向量,对所述图像上下文向量和所述术语上下文向量进行融合,得到输出向量,根据所述输出向量计算预测均值和预测协方差,根据所述预测均值和所述预测协方差计算下一时间步对应的所述查询向量,多次迭代,根据最后一个所述查询向量得到文本潜向量; 基于所述文本潜向量获取每个位置对应的隐藏状态向量;计算所述隐藏状态向量与每个所述词语的词向量之间的匹配分数;获取优先权重和优先偏置,计算所述优先权重和所述隐藏状态向量的乘积,再加上所述优先偏置得到优先中间值,并计算所述优先中间值对应的激活值;获取系数上限和系数下限,计算所述系数上限和所述系数下限的差值,计算所述激活值和所述差值的乘积,再加上所述系数下限,得到优先系数,并将所述优先系数与相应的所述匹配分数相乘,对所述匹配分数进行更新;基于所有所述匹配分数计算每个所述词语在所述位置的概率值,根据所述概率值确定所述位置对应的候选词,根据所有所述候选词得到图像标注文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励