Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京锐我活力科技有限公司张淳获国家专利权

北京锐我活力科技有限公司张淳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京锐我活力科技有限公司申请的专利一种基于深度强化学习的游戏智能体设计方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121093992B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511246653.2,技术领域涉及:G06N3/006;该发明授权一种基于深度强化学习的游戏智能体设计方法及系统是由张淳设计研发完成,并于2025-09-02向国家知识产权局提交的专利申请。

一种基于深度强化学习的游戏智能体设计方法及系统在说明书摘要公布了:本发明涉及游戏智能设计技术领域,且公开了一种基于深度强化学习的游戏智能体设计方法及系统,包括:对用户进行数据采集和用户行为分析,并进行分组和分组训练,进行跨集合整合训练,形成反馈驱动的迭代训练,识别与当前游戏相关的其他游戏,并进行数据采集和分析,进行跨游戏用户分组与训练,数据融合后进行最终训练,生成通用智能体,该基于深度强化学习的游戏智能体设计方法及系统,收集全面的用户行为和反馈数据,涵盖不同类型的数据,确保智能体能够学习到用户行为的多样性,通过特征提取和行为模式识别,深入理解用户的思维方式和游戏习惯,有效提升智能体的性能和用户体验,确保其在不同用户群体和游戏场景中的适应性和竞争力。

本发明授权一种基于深度强化学习的游戏智能体设计方法及系统在权利要求书中公布了:1.一种基于深度强化学习的游戏智能体设计方法,其特征在于:包括: 对游戏服务器中的所有用户进行数据采集; 对游戏服务器中的所有用户进行用户行为分析; 对游戏服务器中的用户进行分组,并相应进行分组训练; 根据分组训练的情况,进行跨集合整合训练; 采集用户对训练后的智能体的反馈情况,并基于用户的反馈情况形成反馈驱动的迭代训练; 识别与当前游戏相关的其他游戏,并进行数据采集和分析; 根据对与当前游戏相关的其他游戏所采集和分析的数据,进行跨游戏用户分组与训练; 将当前游戏和相关游戏的所有训练数据进行融合,并进行最终训练,生成一个能够适应多种用户行为和习惯的通用智能体; 采集用户对训练后的智能体的反馈情况,并基于用户的反馈情况形成反馈驱动的迭代训练,具体为: 从游戏服务器中的所有用户中,选择一组用户进行体验测试: ; 其中,是所有用户的集合,是被选中进行体验测试的用户集合,是根据预定的条件从游戏服务器中的所有用户中选择一组用户的函数; 为用户提供与训练环境一致的游戏环境,并将训练后的智能体部署到游戏环境中; 用户与智能体交互,生成体验数据:; 其中,为模拟用户与全局智能体之间的游戏交互过程,以评估智能体的表现的函数,通过实际的游戏交互,收集用户与智能体之间的互动数据,为后续分析智能体的表现和用户满意度提供原始素材; 对于用户中的每个用户,收集其直接反馈: ; 其中,为获取用户对智能体表现的直接评价; 收集用户的间接反馈数据,并进行归一化处理: ; ; 其中,为归一化处理后的游戏时长,为归一化处理后的留存率,和分别是所有用户游戏时长的最大值和最小值,和分别是所有用户留存率的最大值和最小值,和分别是归一化处理前的游戏时长和留存率; 整合间接反馈数据:; 将直接反馈和间接反馈拼接成综合反馈向量:; 形成综合反馈数据集:; 对于用户中的每个用户的评论进行情感分析,识别正面和负面反馈,得到情感分数:; 其中,为分析用户评论的情感倾向的函数; 计算每个行为特征的重要性分数:; 其中,为评估不同特征在用户反馈中的重要性,帮助团队确定哪些特征对用户体验影响最大,从而可以优先考虑优化这些特征的函数; 对综合反馈数据集进行聚类,得到聚类结果: ; 根据反馈分析结果,定义改进目标:; 从原始训练数据中筛选出与改进目标相关的数据: ; 其中,为判断数据是否与改进目标相关的函数,用于筛选出对改进目标有用的数据; 使用改进数据集对智能体进行针对性训练,更新策略网络和价值函数:; 其中,为使用PPO算法进行训练的函数,用于根据提供的数据和初始模型,训练并返回改进后的策略网络和价值函数; 将改进后的策略网络和价值函数更新到全局智能体中: ; ; 重复执行对于用户中的每个用户,收集其直接反馈至将改进后的策略网络和价值函数更新到全局智能体中之间的整体步骤,直到智能体的性能达到满意水平。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京锐我活力科技有限公司,其通讯地址为:100144 北京市石景山区八大处路49号院6号楼二层2172号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。