罗伯特·博世有限公司;皇家飞利浦有限公司M·赫尔曼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉罗伯特·博世有限公司;皇家飞利浦有限公司申请的专利具有等变策略的物理环境交互获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114467094B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080063639.8,技术领域涉及:G06N3/006;该发明授权具有等变策略的物理环境交互是由M·赫尔曼;M·韦林;H·范胡夫;E·范德珀;D·沃拉尔;F·A·奥利霍克设计研发完成,并于2020-09-08向国家知识产权局提交的专利申请。
本具有等变策略的物理环境交互在说明书摘要公布了:本发明涉及一种根据策略与物理环境交互的计算机实施的方法800。所述策略基于所述物理环境的可观测状态来确定相应动作的多个动作概率。所述策略包括由参数集合参数化的神经网络。所述神经网络通过从可观测状态确定最终层输入并且将所述神经网络的最终层应用于所述最终层输入来确定所述动作概率。通过将等变的基础权重矩阵的集合的线性组合应用于所述最终层输入来应用所述最终层。所述基础权重矩阵是等变的,在这个意义上,对于所述最终层输入的多个预定义变换的集合,每个变换导致用于所述最终层输入的基础权重矩阵输出的对应预定义动作置换。
本发明授权具有等变策略的物理环境交互在权利要求书中公布了:1.一种根据策略与物理环境交互的计算机实施的方法800,所述策略基于所述物理环境的可观测状态来确定相应动作的多个动作概率,其中所述策略包括由参数集合参数化的神经网络,所述神经网络通过从可观测状态确定最终层输入并且将所述神经网络的最终层应用于所述最终层输入来确定所述动作概率,该方法包括: -访问810所述策略的参数集合; -获得820代表用于所述神经网络的所述最终层的基础权重矩阵的集合的基础权重矩阵数据,其中对于所述最终层输入的多个预定义变换的集合,每个变换导致用于所述最终层输入的基础权重矩阵输出的对应预定义动作置换; -控制830与所述物理环境的交互,所述控制通过重复地: -从一个或多个传感器获得832指示所述物理环境的可观测状态的传感器数据; -基于所述可观测状态确定834所述动作概率,包括通过将基础权重矩阵的所述集合的线性组合应用于所述最终层输入来应用所述神经网络的最终层,所述线性组合的系数包含在所述参数集合中; -向致动器提供836导致所述致动器基于所确定的动作概率在所述物理环境中实现动作的致动器数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人罗伯特·博世有限公司;皇家飞利浦有限公司,其通讯地址为:德国斯图加特;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。