杭州衡泰技术股份有限公司张伯雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州衡泰技术股份有限公司申请的专利一种基于离线强化学习的风险管理系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119941408B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411693768.1,技术领域涉及:G06Q40/06;该发明授权一种基于离线强化学习的风险管理系统是由张伯雷;徐行;严军荣;陈宏;吴杰;张丽君设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。
本一种基于离线强化学习的风险管理系统在说明书摘要公布了:本发明公开了一种基于离线强化学习的风险管理系统,包括:离线数据集生成模块:将离线数据根据筛选策略和四元组数据格式生成离线数据集;序列数据生成模块:根据离线数据集训练监督学习模型,根据监督学习模型生成序列数据;风险重构模块:根据序列数据的变化值和训练数据计算风险调节值并以此重构风险函数;所述训练数据包括训练次数、训练时间、训练完成度的任一项或多项组合;最小风险策略生成模块:根据重构的风险函数计算最小化风险值,将最小化风险值输入监督学习模型,得到最小风险策略函数。本发明解决了策略试错成本高、与真实环境的交互效率低和策略优化效率低的问题。
本发明授权一种基于离线强化学习的风险管理系统在权利要求书中公布了:1.一种基于离线强化学习的风险管理系统,其特征在于,包括: 离线数据集生成模块:将离线数据根据筛选策略和四元组数据格式生成离线数据集;所述四元组数据格式为:状态st、行为at、下一时刻状态st+1、风险Rt; 自动驾驶领域中,所述状态st表示在每一个时刻t收集到的与驾驶相关的环境状态,包括行驶路面信息、车辆状态信息、驾驶人员状态信息、交通状态信息;所述行为at表示在环境中每一个时刻t内做出的相关行为或动作,包括方向盘操纵杆操作、换挡杆操作、灯光变换、喇叭鸣响、后视镜移动、安全带收紧解除、座椅调整、安全气囊弹出; 或气候灾害预警领域中,所述状态st表示在每一个时刻t收集到的环境状态,包括温度、湿度、气压、风力、云层厚度、降水概率、雷暴指数;所述行为at表示在环境中每一个时刻t内做出的相关行为或动作,包括气候播报、灾害等级确定、气候灾害预警、紧急通知; 序列数据生成模块:根据离线数据集训练监督学习模型,根据监督学习模型生成序列数据; 风险重构模块:根据序列数据的变化值和训练数据计算风险调节值并以此重构风险函数;所述训练数据包括训练次数、训练时间、训练完成度的任一项或多项组合; 所述根据序列数据的变化值和训练数据计算风险调节值,包括:根据监督学习模型输出的序列数据的方差和或标准差和或平均变化值计算预测确定性权重值;根据强化学习训练时间和或训练次数和或训练完成度计算收敛性权重值;根据预测确定性权重值与风险的负相关关系和或收敛性权重值与风险的正相关关系计算风险调节值; 所述风险函数是根据序列数据中的风险值与风险调节值的正相关关系计算得到; 最小风险策略生成模块:根据重构的风险函数计算最小化风险值,将最小化风险值输入监督学习模型,得到最小风险策略函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州衡泰技术股份有限公司,其通讯地址为:310012 浙江省杭州市西湖区教工路23号百脑汇科技大厦1215室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励