网易(杭州)网络有限公司熊宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉网易(杭州)网络有限公司申请的专利奖励数据分析方法、装置、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116492688B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310542774.6,技术领域涉及:A63F13/60;该发明授权奖励数据分析方法、装置、设备、存储介质及程序产品是由熊宇;方星辰;关凯;吴润泽;吕唐杰;范长杰;胡志鹏设计研发完成,并于2023-05-11向国家知识产权局提交的专利申请。
本奖励数据分析方法、装置、设备、存储介质及程序产品在说明书摘要公布了:本申请提供一种奖励数据分析方法、装置、设备、存储介质及程序产品。该方法包括:采集待解释模型执行对局产生的目标数据;其中,目标数据,包括:对局内机器人在每一时刻对应的状态数据下执行动作数据所得到的奖励数据以及状态数据、动作数据和奖励数据之间相互关联的映射关系;利用神经网络模型推理得到与状态数据和动作数据对应的奖励数据;确定状态数据针对期望值的第一SHAP值以及动作数据针对期望值的第二SHAP值;第一SHAP值用于表征状态数据对期望值的影响程度,第二SHAP值用于表征动作数据对期望值的影响程度;根据第一SHAP值调整机器人的状态数据对应的奖励数据,并根据第二SHAP值调整机器人的动作数据对应的奖励数据。
本发明授权奖励数据分析方法、装置、设备、存储介质及程序产品在权利要求书中公布了:1.一种奖励数据分析方法,其特征在于,所述方法包括: 采集待解释模型执行对局产生的目标数据;其中,所述目标数据,包括:所述对局内机器人在每一时刻对应的状态数据下执行动作数据所得到的奖励数据以及所述状态数据、所述动作数据和所述奖励数据之间相互关联的映射关系; 利用预先训练得到的神经网络模型根据所述映射关系对所述状态数据和所述动作数据推理得到与所述状态数据和所述动作数据对应的奖励数据的期望值; 确定所述状态数据针对所述期望值的第一SHAP值以及所述动作数据针对所述期望值的第二SHAP值,包括:利用TreeSHAP解释性方法对训练得到的集成树监督模型进行解释以得到所述状态数据针对所述期望值的第一SHAP值以及所述动作数据针对所述期望值的第二SHAP值;其中,所述第一SHAP值用于表征所述状态数据对所述期望值的影响程度,所述第二SHAP值用于表征所述动作数据对所述期望值的影响程度; 根据所述第一SHAP值调整所述机器人的状态数据对应的所述奖励数据,并根据所述第二SHAP值调整所述机器人的动作数据对应的所述奖励数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人网易(杭州)网络有限公司,其通讯地址为:310056 浙江省杭州市滨江区长河街道网商路599号4幢7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励