山东大学武蕾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利一种基于文本的场景图片编辑方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524070B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310308547.7,技术领域涉及:G06T11/60;该发明授权一种基于文本的场景图片编辑方法及系统是由武蕾;李瑞琛;董沛;孟雷;孟祥旭设计研发完成,并于2023-03-23向国家知识产权局提交的专利申请。
本一种基于文本的场景图片编辑方法及系统在说明书摘要公布了:本发明提出了一种基于文本的场景图片编辑方法及系统,通过将文本指令中的物体信息和位置信息转换为在场景中可视化空间掩码,从而确定准确的所有需要编辑的位置;通过将接收的文本指令和需要编辑的场景中的多个目标进行多模态对齐,并将其和空间掩码相结合,生成所述的编辑之后的场景,可实现根据文本指令一次性处理场景图片中多个需要编辑的目标物体,不需要通过迭代的方式,处理效率较高。
本发明授权一种基于文本的场景图片编辑方法及系统在权利要求书中公布了:1.一种基于文本的场景图片编辑方法,其特征在于,包括: 获取文本指令和待编辑的场景; 根据所述文本指令得到文本特征向量,将所述文本特征向量中的物体信息和位置信息转换为空间掩码; 根据所述待编辑的场景得到场景特征图,将所述场景特征图与所述文本特征向量进行融合,得到视觉特征图; 将所述视觉特征图与所述空间掩码进行结合,得到编辑后的场景; 通过构建的空间语义增强模块将所述文本特征向量中的物体信息和位置信息转换为空间掩码,具体为: 所述空间语义增强模块包括依次连接的第一选择模块至第六选择模块,所述第一选择模块和第二选择模块之后分别连接有注意力模块,第三选择模块至第六选择模块之后分别连接有卷积模块; 所述选择模块包括linear线性层、RELU激活函数层,所述选择模块分别对所述文本特征向量、上一模块的输出特征向量进行处理后并合并,得到选择特征向量; 所述注意力模块对所述文本特征向量、所述选择特征向量进行处理得到注意力特征向量; 所述卷积模块对所述文本特征向量、所述选择特征向量进行处理得到最终的空间掩码; 将所述场景特征图与所述文本特征向量进行融合,得到视觉特征图,具体包括: 将文本特征向量的标准偏差乘以标准高斯分布的噪声,然后与所述文本特征向量的平均值相加,得到条件文本特征; 利用缩放点积注意力计算方式对所述条件文本特征进行加权处理,得到第一文本特征; 将第一文本特征与所述场景特征图进行拼接,并经卷积处理后得到第二文本特征; 将所述第二文本特征分别经过卷积操作,得到第一调制参数和第二调制参数; 所述第一调制参数与所述场景特征图矩阵相乘后再与所述第二调制参数对应元素相加,得到视觉特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250101 山东省济南市高新区舜华路1500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励