Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 创意信息技术股份有限公司花福军获国家专利权

创意信息技术股份有限公司花福军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉创意信息技术股份有限公司申请的专利一种基于上下文提示的世界模型增强方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120373360B

龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510855255.4,技术领域涉及:G06N3/0455;该发明授权一种基于上下文提示的世界模型增强方法及装置是由花福军;胡小刚;罗钦;王波;孙明;惠孛设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。

一种基于上下文提示的世界模型增强方法及装置在说明书摘要公布了:本发明提供了一种基于上下文提示的世界模型增强方法及装置,属于深度强化学习技术领域。方法根据当前图像输入得到图像描述语句;通过卷积神经网络得到当前图像输入的向量表示,利用语言模型得到图像描述语句的向量表示,将图向量表示与语句向量表示拼接,得到新的向量表示;将新的向量表示利用循环神经网络实现对世界模型的建模,世界模型根据当前的向量输入,在历史动作和环境信息上下文基础上进行动作决策,有效减轻了智能体探索时的轨迹回退现象出现的频率。在环境变化时,智能体能根据上下文信息及时进行调整,提高智能体的适应性与灵活性。本发明有效减少了智能体错误决策的可能性,有效提升了在限定步数之内智能体的背景任务完成数量。

本发明授权一种基于上下文提示的世界模型增强方法及装置在权利要求书中公布了:1.一种基于上下文提示的世界模型增强方法,其特征在于,包括: 获取仿真环境的背景任务描述语句、环境观测图像和智能体的历史动作指令信息,并利用多模态大语言模型从所述环境观测图像中提取出图像描述语句上下文信息;其中,所述历史动作指令信息拼接在图像描述语句上下文信息的语句末尾; 利用卷积神经网络对所述环境观测图像进行视觉特征提取,得到图像特征向量,并对所述背景任务描述语句和图像描述语句上下文信息进行文本特征提取,分别得到背景任务特征向量和上下文文本特征向量,同时将背景任务特征向量与上下文文本特征向量拼接为第一文本特征向量,并将第一文本特征向量与所述图像特征向量进行融合,得到融合特征向量; 将智能体的历史动作指令信息和融合特征向量输入循环神经网络中进行确定性状态更新,并根据确定性状态更新结果对当前仿真环境进行建模,得到世界模型; 智能体基于世界模型,利用演员评论家算法进行想象学习,并根据想象学习结果确定智能体的当前最佳动作序列;依据当前最佳动作序列在仿真环境中执行动作,同时获取执行动作后仿真环境给出的动作反馈、环境状态更新信息和更新后的智能体可视图像,判断动作执行后是否成功完成仿真环境中的背景任务,若动作执行后未成功完成背景任务,则依据更新后的智能体可视图像进行动作决策,根据动作决策结果调整当前最佳动作序列,并执行下一动作;若动作执行后成功完成背景任务,则仿真环境同时返回值为1的奖励。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人创意信息技术股份有限公司,其通讯地址为:610000 四川省成都市青羊区红星路一段86号1栋222号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。