上海人工智能创新中心李学龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海人工智能创新中心申请的专利一种价值驱动的跨域策略泛化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116360257B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310246276.7,技术领域涉及:G05B13/04;该发明授权一种价值驱动的跨域策略泛化方法及系统是由李学龙;白辰甲;徐康;赵斌;王震设计研发完成,并于2023-03-14向国家知识产权局提交的专利申请。
本一种价值驱动的跨域策略泛化方法及系统在说明书摘要公布了:本发明总的来说涉及强化学习技术领域,提出一种价值驱动的跨域策略泛化方法及系统。该方法包括:提供源域训练数据以及目标域训练数据;基于价值驱动筛选源域训练数据;以及将筛选出的源域训练数据以及目标域训练数据输入智能体中进行训练。本发明在源域自身不需要改变的同时,算法不再专注数据的动力学一致性,而是从价值的跨域一致性对源域数据进行筛选,能够有效提高强化学习中策略的泛化能力,进而可以有效节约运算资源。
本发明授权一种价值驱动的跨域策略泛化方法及系统在权利要求书中公布了:1.一种价值驱动的跨域策略泛化方法,其特征在于,包括下列步骤: 提供源域训练数据以及目标域训练数据: 筛选源域训练数据,其中包括: 提供状态动作数据对s,a,确定源域下一时刻状态s′src,并且通过目标域动力学模型确定目标域下一时刻状态集合 通过价值函数网络对所述源域下一时刻状态s′src以及所述目标域下一时刻状态集合进行价值评估以生成源域状态价值Qsrc以及目标域状态价值集合以及 比较所述生成源域状态价值Qsrc以及目标域状态价值集合筛选出状态价值差距小于阈值∈的源域训练数据;以及 将筛选出的源域训练数据以及目标域训练数据输入智能体中进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海人工智能创新中心,其通讯地址为:200232 上海市徐汇区云锦路701号37、38层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。