北京极佳视界科技有限公司朱政获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京极佳视界科技有限公司申请的专利场景生成与交互方法、装置、电子设备、介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120726238B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510904718.1,技术领域涉及:G06T17/00;该发明授权场景生成与交互方法、装置、电子设备、介质和程序产品是由朱政;李宸鑫;刘恒宇;倪超骏;杨智钦;黄冠设计研发完成,并于2025-07-01向国家知识产权局提交的专利申请。
本场景生成与交互方法、装置、电子设备、介质和程序产品在说明书摘要公布了:本公开实施例公开了一种场景生成与交互方法、装置、电子设备、介质和程序产品,利用单幅图像提示图像生成三维场景第一三维场景图像,并通过调用预先训练好的多模态特征提取模型从提示图像中提取多模态二维特征图多模态的语义特征,并通过蒸馏与融合算法将多模态二维特征图与三维场景第一三维场景图像融合为多模态特征场,最终渲染得到包括多模态二维特征场的目标场景,用户可以通过用户操作指令对所目标场景进行交互操作。如此,实现了在单图像交互式目标场景生成中,实时嵌入多模态的语义特征并保持高质量渲染,基于多模态的语义特征,可以完成用户操作指令解析、任务拆解等,以实现对目标场景的复杂场景查询与可组合编辑。
本发明授权场景生成与交互方法、装置、电子设备、介质和程序产品在权利要求书中公布了:1.一种场景生成与交互方法,其特征在于,所述方法包括: 响应于接收到的任一幅提示图像,根据所述提示图像生成第一三维场景图像,所述提示图像包括用于生成目标场景的场景提示内容; 通过调用预先训练好的多模态特征提取模型从所述提示图像中提取多模态二维特征图,所述多模态二维特征图包括有多模态的语义特征; 利用预设特征蒸馏与融合算法对所述多模态二维特征图与所述第一三维场景图像进行特征融合处理,得到第一多模态特征场; 对所述第一多模态特征场进行图像渲染,得到第二三维场景图像,所述第二三维场景图像为目标场景; 响应于接收到的用户操作指令,基于所述用户操作指令对所述目标场景进行交互操作,所述用户操作指令包括文本提示内容和参考图像,包括: 响应于接收用户操作指令,从所述文本提示内容和参考图像中确定用户操作意图; 对所述用户操作意图进行分解为子任务序列,所述子任务序列包括按序执行的多个子任务; 通过预设场驱动函数调用协议调用场插件对所述目标场景按序执行所述子任务序列,并更新所述目标场景; 采用文本场景描述及可视化方式向用户反馈对所述目标场景的更新结果; 其中,所述多模态特征提取模型至少包括对比语言-图像预训练模型、通用分割模型、无标签自蒸馏视觉模型和视觉-语言模型;所述通过调用预先训练好的多模态特征提取模型从所述提示图像中提取多模态二维特征图,所述多模态二维特征图包括有多模态的语义特征,包括: 调用对比语言-图像预训练模型,从所述提示图像中提取全局语义特征图; 调用通用分割模型,从所述提示图像中提取实例分割掩码特征图; 调用无标签自蒸馏视觉模型,从所述提示图像中提取局部细粒度特征图; 调用视觉-语言模型,从所述提示图像中提取视觉-语言对齐特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京极佳视界科技有限公司,其通讯地址为:102206 北京市昌平区能源东路1号院1号楼3层304-68(集群注册);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励