当前位置 : 首页 > 专利喜报 > 华东师范大学贺樑获国家专利权

华东师范大学贺樑获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉华东师范大学申请的专利一种基于逆强化学习的人在回路新闻推荐方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116304304B 。

龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310099499.5，技术领域涉及：G06F16/9535；该发明授权一种基于逆强化学习的人在回路新闻推荐方法是由贺樑;吴安然;吴兴蛟;肖路巍;马天龙设计研发完成，并于2023-02-10向国家知识产权局提交的专利申请。

本一种基于逆强化学习的人在回路新闻推荐方法在说明书摘要公布了：本发明公开了一种基于逆强化学习的人在回路新闻推荐方法，属于数据分析与挖掘技术领域。首先为推荐系统初始化一个推荐策略，并计算出初始策略的期望；专家根据用户信息和新闻内容提供推荐方式，根据专家提供的推荐方式计算出专家推荐方式的期望；根据约束条件求解出最优的奖励函数的权重参数，用于更新奖励函数；然后让推荐系统根据更新后的奖励函数进行强化学习，得到当前奖励函数下的最优策略，并计算得到该策略推荐方式的期望，将该期望与专家推荐方式期望进行比较，若差距大于设定阈值，则继续按照上述方式更新奖励函数，否则停止迭代，得到当前最优的奖励函数，可以用该奖励函数进行强化学习新闻推荐。

本发明授权一种基于逆强化学习的人在回路新闻推荐方法在权利要求书中公布了：1.一种基于逆强化学习的人在回路新闻推荐方法，其特征在于，包括以下步骤： 1为推荐系统随机初始化一个推荐策略，并计算出初始策略的期望； 2专家根据用户信息和新闻内容提供推荐方式，根据专家提供的推荐方式计算出专家推荐方式的期望； 3根据约束条件求解出最优的奖励函数的权重参数，用于更新奖励函数； 4让推荐系统根据得到的奖励函数进行强化学习，得到当前奖励函数下的最优策略，并计算得到该策略推荐方式的期望； 5计算强化学习模块得到的最优策略期望与专家推荐方式期望之间的差距，若差距大于设定阈值，则重复步骤3和步骤4；若差距小于或等于设定阈值则停止迭代，固定奖励函数权重向量进行强化学习新闻推荐；其中：所述步骤1具体为： 1.1随机为推荐系统初始化一个推荐策略；通过随机生成强化学习模块的参数为推荐系统随机初始化一个初始推荐策略；所述强化学习模块即为用于得到推荐新闻的模块； 1.2向强化学习模块中输入用户最近浏览过的10篇新闻和待推荐给用户的10篇新闻，输出一个10维向量，表示待推荐的10篇新闻被推荐给用户的概率； 1.3将待推荐的10篇新闻分别送进一个长短期记忆网络得到每篇新闻的特征向量，将待推荐的10篇新闻中每篇新闻的特征向量与步骤1.2中得到的概率对应相乘相加得到随机初始化推荐策略的期望。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人华东师范大学，其通讯地址为：200241 上海市闵行区东川路500号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

华东师范大学贺樑获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务