渊慧科技有限公司B.范罗伊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉渊慧科技有限公司申请的专利使用超模型的探索获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114341895B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080062843.8,技术领域涉及:G06N20/00;该发明授权使用超模型的探索是由B.范罗伊;陆修远;V.R.德瓦拉切尔拉;Z.温;M.伊布拉希米;I.D.M.奥斯本设计研发完成,并于2020-09-25向国家知识产权局提交的专利申请。
本使用超模型的探索在说明书摘要公布了:用于控制代理的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。一种方法包括:根据连续空间上的概率分布从可能索引变量的连续空间采样一个或多个索引变量;对于每个索引变量:根据超模型的多个参数值使用超模型处理索引变量,以生成指定环境模型的多个参数值的输出,并且根据由超模型输出为索引变量指定的环境模型的多个参数值,使用环境模型生成动作选择输出;以及使用针对一个或多个索引变量的一个或多个动作选择输出来选择要由代理在该时间步骤处执行的动作。
本发明授权使用超模型的探索在权利要求书中公布了:1.一种用于选择要由与环境交互的代理执行的动作的方法,所述方法包括,在多个时间步骤中的每个时间步骤处: 根据可能索引变量的连续空间上的概率分布,从所述可能索引变量的连续空间采样一个或多个索引变量; 对于所述一个或多个索引变量中的每个索引变量: 根据超模型的多个参数值使用所述超模型处理所述索引变量,以生成指定环境模型的多个参数值的超模型输出;并且 根据由所述超模型输出为所述索引变量指定的所述环境模型的多个参数值,使用所述环境模型生成动作选择输出;以及 使用针对所述一个或多个索引变量的一个或多个动作选择输出来选择要由所述代理在所述时间步骤处执行的动作, 其中,根据由所述超模型输出为所述索引变量指定的所述环境模型的多个参数值,使用所述环境模型生成动作选择输出包括,对于能够由所述代理执行的可能动作集合中的每个动作: 使用所述环境模型处理包括指定所述动作的数据的输入,以生成对所述代理将会接收到的奖励的估计,作为执行所述动作的结果, 其中,所述输入还包括表征在所述时间步骤处的所述环境的当前状态的观测,所述观测包括图像、对象位置数据或传感器数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人渊慧科技有限公司,其通讯地址为:英国伦敦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励