Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 安徽大学吴巧云获国家专利权

安徽大学吴巧云获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉安徽大学申请的专利一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120023815B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510341347.0,技术领域涉及:B25J9/16;该发明授权一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法是由吴巧云;李祥雨;穆朝絮;曹翔设计研发完成,并于2025-03-21向国家知识产权局提交的专利申请。

一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法在说明书摘要公布了:本发明提出一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法,其具体包括以下步骤:采集观测信息,搭建策略‑价值网络指导机械臂进行家具组装,并设计噪声脉冲神经网络作为策略网络;基于群体编码设计编码层,将观测信息转换为脉冲序列;设计具有噪声的脉冲神经层,根据脉冲序列,输出最终的脉冲活动;通过具有噪声的非脉冲的解码层,将脉冲活动转换为动作表达;设计动态调整噪声水平优化方法,修改损失函数来实现噪声‑策略的平衡;优化网络参数,得到最优模型,指导机械臂完成组装任务。本发明为机械臂在资源受限场景中持续作业提供了保证,推动智能装备在智能制造领域的实用化发展。

本发明授权一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法在权利要求书中公布了:1.一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法,其特征在于,具体包括以下步骤: S1、采集家具组装任务场景中机械臂的观测信息,搭建策略-价值网络指导机械臂进行家具组装,并设计噪声脉冲神经网络作为策略网络;所述噪声脉冲神经网络包括编码层、脉冲神经层和解码层; S2、基于群体编码设计编码层,将观测信息转换为确定性的脉冲序列,脉冲序列为神经元在编码过程中产生的离散时间脉冲集合,表示观测信息的时间和强度特征; S3、设计具有噪声的脉冲神经层,根据步骤S2得到的脉冲序列,输出最终的脉冲活动,脉冲活动为神经元在神经层中的整体动态行为,反映神经元的激活状态;步骤S3具体包括: S31、设计具有噪声的电路漏电-充电-放电工作原理的脉冲神经层,其中的任意一个脉冲神经元的电流按如下规则更新: 其中,δ表示电流衰减率,Xt表示外部输入;l表示该神经元所在的脉冲神经网络的层数,m表示该层第m个神经元; S32、在神经元充电过程中引入噪声,则任意一个具有噪声的脉冲神经元的充电电压按如下规则更新: 其中,v表示放电后的膜电压,η表示电压衰减率,其中σv表示噪声参数,εv表示从任何随机过程中提取的噪声; S33、根据更新后的充电电压,将任意一个脉冲神经元脉冲信号按如下规则更新并发放: 其中,Θ·对输入充电点云中的每个元素进行处理,若超过阈值Vth,则取1,否则取0;σs表示噪声参数,εs表示从任何随机过程中提取的噪声; S34、发放脉冲信号后,对膜电位进行重置,放电后的膜电位vt更新规则如下: 其中,Vrest表示静息电位; S4、再通过具有噪声的非脉冲的解码层,将输入的脉冲活动转换为动作表达,具体包括: S41、设计注入噪声的非脉冲积分-放电工作原理的神经元作为解码层;在每个时间步t,解码层中第r个神经元的膜电位vrt根据脉冲神经层发出的脉冲信号进行更新,更新规则如下: vrt=vrt-1+xt; 其中,xt表示的是当前时间步的脉冲信号输入;如果模型当前处于训练模式,则还在输入中加入噪声,加入噪声后膜电位的更新方式为: vrt=vrt-1+xt+σs⊙εs; 其中,σs表示噪声参数,εs表示从任何随机过程中提取的噪声; S42、通过解码层中神经元的膜电位[vr1,vr2,…,vrT]来获得直观的动作表达,具体解码方式是计算整个时间序列的平均膜电位,公式表达为: 其中,out表示得到的动作表达; S5、设计动态调整噪声水平优化方法,通过修改损失函数来实现噪声的动态调整,在保证充分探索的同时提高训练效率;步骤S5具体包括: S51、将构建的噪声脉冲神经网络作为策略网络,并计算其原始损失Lold;再并将原始损失与解码层中非脉冲神经元的噪声方差之和作为策略网络新的损失函数Lnew,公式表达为: 其中,NA表示动作维度,σi是第i个非脉冲神经元的噪声标准差,k是控制原始渐变更新方向和降噪方向之间更新比率的系数,其值根据当前的奖励和任务动态调整; S52、当奖励值较低时,较小的k值鼓励机械臂利用噪声探索新的策略;当奖励值较高时,较大的k值控制机械臂减少噪声的使用,专注于利用现有策略以获取更大的奖励;k的公式表达为: 其中,k0是控制损失项大小的因子;Rmean表示多次训练后的平均奖励值;Rmax表示最高奖励值;Rmin表示最低奖励值; S6、基于深度强化学习框架SAC优化噪声脉冲神经网络的参数,得到最优模型;利用训练好的最优模型指导机械臂完成家具组装任务。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。