Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天津大学;杭州电子科技大学;中国电子科技集团公司第三十研究所刘安安获国家专利权

天津大学;杭州电子科技大学;中国电子科技集团公司第三十研究所刘安安获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天津大学;杭州电子科技大学;中国电子科技集团公司第三十研究所申请的专利基于常识引导的文本到图像生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116662596B

龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310690876.2,技术领域涉及:G06F16/583;该发明授权基于常识引导的文本到图像生成方法及装置是由刘安安;孙泽方;徐宁;颜成钢;郑博仑;吕博;段玉龙;张勇东设计研发完成,并于2023-06-12向国家知识产权局提交的专利申请。

基于常识引导的文本到图像生成方法及装置在说明书摘要公布了:本发明公开了一种基于常识引导的文本到图像生成方法及装置,通过将丰富的常识知识描述分步、逐一地加入上采样融合块的方式,建立知识描述与生成图像区域的语义映射关系,增强生成图像区域的视觉真实性,最后通过融合所有图像区域合成高质量图像。方法包括:检索ConceptNet外部常识库中的相关常识三元组并对其进行过滤;对输入的描述语句进行场景图解析得到场景三元组;将原始语句和知识描述输入到生成对抗网络的生成器中生成图像;判别器计算对抗损失,并更新生成器网络的参数;生成器和判别器进行交替优化,最终生成质量最好的图像用于新闻内容智能生成领域。装置包括:处理器和存储器。

本发明授权基于常识引导的文本到图像生成方法及装置在权利要求书中公布了:1.一种基于常识引导的文本到图像生成方法,其特征在于,所述方法包括: 构建先验知识库并从中选择和输入语句相关的文本描述以丰富单一的文本输入; 提取输入语句中的名词,以每个名词为条件,检索ConceptNet外部常识库中的相关常识三元组并对常识三元组进行过滤; 对输入的描述语句进行场景图解析得到若干个由主语-谓词-宾语构成的场景三元组并将其作为结构化知识; 将原始语句和知识描述输入到生成对抗网络的生成器中生成图像; 判别器以合成图像和对应的文本向量作为输入计算对抗损失,并更新生成器网络的参数;生成器和判别器进行交替优化,生成器最终生成质量最好的图像,该图像用于新闻内容智能图像生成; 所述生成器包括:上采样知识融合块, 每个上采样知识融合块分步、逐一加入1个额外文本知识特征向量、1个场景三元组知识特征向量、1个经注意力融合的常识三元组特征向量,在前向上采样生成过程中,每个上采样融合块中加入不同的知识描述特征; 通过下述公式计算基于注意力机制融合的常识三元组特征向量: Fattnes,ecs=α1ecs1+α2ecs2+…+αmecsm 其中,es代表输入句子的特征向量,ecs代表每个条件名词对应的k个常识三元组特征向量集合,ecsi代表k个常识三元组特征向量集合中第i个常识三元组特征向量,αi代表第i个常识特征三元组的权重;es·ecsi代表es特征向量与ecsi特征向量的点积;基于常识引导的通道级仿射变换对中间视觉变量按照如下方式执行: γc=Lγes+etri,βc=Lβes+est βc′=LβFattnes,ecs+etext 其中,xchw是中间视觉变量的一个通道上的特征,es是输入文本的特征向量,est是结场景三元组特征向量,etext是额外文本知识特征向量,Fattnes,ecs是基于注意力机制融合的常识三元组特征向量,γc和βc是仿射变换在xchw通道特征上的缩放参数和偏置参数,Lγ·和Lβ·分别代表预测缩放参数γc和偏置参数βc的多层感知机,λ是控制修正偏置所占权重的超参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学;杭州电子科技大学;中国电子科技集团公司第三十研究所,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。