Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学罗志勇获国家专利权

重庆邮电大学罗志勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利一种应用于装配序列规划的强化学习混合方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119494422B

龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411324424.3,技术领域涉及:G06N20/20;该发明授权一种应用于装配序列规划的强化学习混合方法是由罗志勇;洪朋振;董鑫设计研发完成,并于2024-09-23向国家知识产权局提交的专利申请。

一种应用于装配序列规划的强化学习混合方法在说明书摘要公布了:本发明请求保护一种应用于装配序列规划的强化学习混合方法,装配序列规划本质上可以理解为一种对产品零件的一种排序,优秀的装配序列可以缩短产品的生产周期,实现生产成本的降低。在本发明中,提出了一种结合了Q‑learning算法以及Sarsa算法的强化学习算法—Greedy‑QS算法用来解决装配序列规划问题。在本发明的工作中首先合理的将待装配产品抽象成几个布尔矩阵表达的数学模型,降低了装配模型的复杂度,提升了算法对于装配序列规划问题的可操作性,再使用Greedy‑QS算法求出最优解。通过实验证明了Greedy‑QS算法在装配序列规划问题中比起Q‑learning算法、Sarsa算法以及Q‑SARSA算法具有更快的收敛速度,得出的最优装配序列的奖励值更高兼具Q‑learning算法和Sarsa算法的优点。

本发明授权一种应用于装配序列规划的强化学习混合方法在权利要求书中公布了:1.一种应用于装配序列规划的强化学习混合方法,其特征在于,包括以下步骤: 步骤S1,针对待装配模型将模型的装配信息进行抽象,装配信息包括零件数量、零件间的接触情况及零件间的约束情况,将装配信息使用布尔矩阵表达; 步骤S2,通过布尔矩阵提供的信息搭建出适用的环境,包括对于状态空间动作空间以及奖励函数的定义; 步骤S3,将Q-learning算法和Sarsa算法以贪婪策略交替更新Q函数从而融合得到Greedy-QS算法;Q-learning算法核心在于学习一个‘Q函数’,在给定状态下采取某一动作所能获得的预期累计奖励;Sarsa其名称来源于五个英文单词的首字母缩写:State-Action-Reward-State-Action算法; 步骤S4,将步骤S2搭建的环境模型应用到Greedy-QS算法迭代逻辑中,最终算法收敛并得到待装配模型的最有装配序列; 所述步骤S3中,在某个状态的动作的Q-value更新前,预先使用Q-learning算法的更新公式以及Sarsa算法的更新公式都进行一次计算,然后让两者得出的Q-value值进行比较,并采用其中值较大的一个应用于这一次的更新; 所述步骤S3中,对ε值的初始定义不在范围0~1之间,而是取了一个大于1的值,并且规定每使用一次ε-greedy策略都会让ε的值逐步递减,直至达到需要的数值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。