Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学长三角研究院(衢州);浙江香满亭生物科技有限公司袁国慧获国家专利权

电子科技大学长三角研究院(衢州);浙江香满亭生物科技有限公司袁国慧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学长三角研究院(衢州);浙江香满亭生物科技有限公司申请的专利一种基于深度强化学习的花菇种植的智能环境控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117694183B

龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410033177.5,技术领域涉及:A01G18/69;该发明授权一种基于深度强化学习的花菇种植的智能环境控制方法是由袁国慧;曾志宏;王卓然;朱佑存;杨礼远;何思佳;秦帅设计研发完成,并于2024-01-09向国家知识产权局提交的专利申请。

一种基于深度强化学习的花菇种植的智能环境控制方法在说明书摘要公布了:本发明专利属于深度强化学习和环境控制领域,提供了一种基于深度强化学习的花菇种植的智能环境控制方法。主旨在于解决传统花菇种植方法中缺乏动态环境调节和智能化环境控制的问题,主要方案包括s1.根据花菇生长过程以及生长环境的控制,构建花菇种植生长环境模型;s2.整合现有的花菇种植的专家经验策略和种植数据,构建智能环境控制算法的采样池,并设计算法的采样策略;s3.根据花菇的生长过程特点,设计指导智能控制算法的奖励函数;s4.设计智能环境控制算法的训练流程,使用智能环境控制算法学习环境控制策略,根据输出的环境控制策略改变花菇生长环境。本发明利用深度强化学习实现花菇种植的智能环境控制,进而提升花菇种植产量。

本发明授权一种基于深度强化学习的花菇种植的智能环境控制方法在权利要求书中公布了:1.一种基于深度强化学习的花菇种植的智能环境控制方法,其特征在于,包括以下步骤: 步骤s1、根据花菇生长过程以及生长环境的控制,建立花菇种植生长环境模型,设计花菇的状态空间,其中状态空间包括花菇生长环境状态空间和花菇生长状态空间,花菇生长环境空间包括花菇生长环境中的环境状态维度以及取值范围;花菇生长状态空间包括花菇的状态维度及其取值范围; 动作空间设计:将环境控制设备定义为智能体,获取花菇种植的动作空间,动作空间包括环境控制设备中可调控的环境参数以及可调幅度; 步骤s2、整合现有的花菇种植的专家经验策略和种植数据,构建智能环境控制算法的采样池,并设计算法的采样策略; 步骤s3、根据花菇的生长过程特点,设计指导智能控制算法的奖励函数,奖励函数设计为花菇生长质量奖励函数,通过所述奖励函数评估环境控制是否实现种植目标,是否提升种植产量; 步骤s4、设计智能环境控制算法的训练流程,使用智能环境控制算法学习环境控制策略,根据输出的环境控制策略改变花菇生长环境; 所述步骤s1包括: 花菇的状态空间包括花菇生长环境状态空间和花菇生长状态空间; 所述的花菇生长环境状态空间包括花菇种植环境的状态维度,表示为: =T,H,C,L,G,D 其中,T表示种植环境的温度,H表示种植环境的湿度,C表示种植环境的二氧化碳浓度,L表示种植环境的光照强度,G表示花菇所处的生长时期,用G的值为0表示花菇处在发菌期,G的值为1表示花菇处在转色期,D表示花菇所处的是白天还是黑夜,用D的值为0表示白天,D的值为1表示黑夜; 考虑到实施的优化,将温度、湿度、二氧化碳浓度通过区域分隔的方式离散化、针对花菇生长的不同时期设计发菌期和转色期两个环境状态,针对花菇的生长光照强度加入白天和黑夜两个环境状态; 所述的花菇生长状态空间包括花菇生长的状态维度,表示为: =Hua_quality 其中Hua_quality为一个0-100的分值,用于表示花菇当前的生长状况,其中分数越高,表示花菇的生长状况越好,100为理想的花菇生长最终状态,通过深度学习的方法评估花菇的生长质量,根据花菇生长的直径、裂口大小以及颜色特征,将花菇的生长状态映射到0-100分值从而进行定量评估,该深度学习的方法首先收集和标记花菇生长过程中的图像数据,然后采用深度学习模型,进行训练和优化,该深度学习模型用以执行生长状态的分类和质量评分的回归任务,最终,通过映射函数将质量评分转换为0-100分值,从而实现对花菇生长质量的精确定量评估; 综上所述花菇状态空间为: =T,H,C,L,G,D,Hua_quality 动作空间包括用于调控环境的设备以及调控方式,使用花菇种植环境中的光照、温度、湿度和风机控制器共4项作为智能环境控制算法的动作空间,其中,光照控制包括光照增强和光照减弱两种状态,湿度控制包括湿度增加和湿度减少两种状态,温度控制包括温度升高和温度降低两种状态,风机控制包括风机开和风机关两种状态,智能环境控制算法根据环境状态信息,选择4个控制器的控制动作,共计16种动作组合构成了智能环境控制算法的动作空间A,用以对花菇生长环境进行相应的调控; 在动作空间的设计中,智能环境控制算法中根据经验对每种动作范围预设一个阈值,表示该动作参数的调控范围,当参数超过阈值会使得环境造成较大变化,从而影响花菇生长,当输出的动作范围超出预设的阈值时,停止动作输出,并且对环境进行纠正处理,控制环境调控设备使得环境各项参数恢复到一个正常的范围内; 所述步骤s3包括: 根据花菇的生长过程特点,设计指导智能控制算法的奖励函数,奖励函数设计为花菇生长质量奖励函数,通过所述奖励函数评估环境控制是否实现种植目标,是否提升种植产量; 花菇生长质量奖励函数设计为:=Hua_quality-target_quality 其中,下标为之定义的下标,Hua_quality为深度学习模型预测的花菇质量评估指标,表示花菇当前的生长状况;target_quality为目标花菇质量,在这里值为100;是花菇生长质量奖励函数,花菇的生长质量越好,花菇生长质量越接近目标花菇质量,对应的函数值越大; 智能控制算法的奖励函数 是控制奖励权重的超参数; 所述步骤s4包括: 设计智能环境控制算法的训练流程,且训练流程为基于专家知识网络的双Q学习算法,将训练总回合数记为M,回合内循环次数记为N,价值网络记为,目标价值网络记为为表示当前价值网络的参数,的含义目标价值网络参数,训练过程包括以下步骤: 步骤5.1、输入花菇状态空间S,动作空间A,折扣率,学习率,时刻t 初始化分层采样经验池D,容量为W; 步骤5.2、遍历所有回合数,执行: 步骤5.2.1、初始化状态S; 步骤5.2.2、遍历循环,执行: 步骤5.2.2.1、在状态的情况下对比分层采样经验池,并选择动作; 步骤5.2.2.2、若状态属于专家经验层的范围内,则根据专家经验层选择动作; 步骤5.2.2.3、若状态属于普通信息经验层的范围内,则根据普通信息经验层; 选择动作; 步骤5.2.2.4、若状态都不属于上述二者范围内,则通过策略选择 动作; 步骤5.2.2.5、判断结束,执行对应的动作,观测种植环境,计算得到新的奖 励,更新新的状态; 步骤5.2.2.6、更新价值网络参数,并将四元组放入分层采样经验 池D,不断更新经验池; 步骤5.2.3、直到状态S到达终止状态,则终止循环,否则将结束当前回合并执行步 骤5.2.2; 步骤5.3、直到DQN价值网络收敛,则终止整个训练,否则将结束当前回合 并执行步骤5.2; 其中对于步骤5.2.2.6,典型的更新双Q学习算法价值网络参数方案步骤如下: 对DQN做正向传播,得到价值网络Q值: 式子表示在的状态下,选择具有最高Q值的动作 式子表示在的状态下,选择动作,则是对应的价值网络Q值, 式子表示在的状态下,选择动作,则是对应的价值网络Q值; 定义对应的目标和误差: 和 对DQN做反向传播,得到梯度: 做梯度下降更新DQN的参数: ,为学习率,它控制了更新步长的大小 设0,1是需要手动调的超参数,做加权平均更新目标价值网络的参数: 对于步骤5.2.2.4,策略为: 表示在的状态下,选择具有最高Q值的动作a,表示是在当前策略下的最佳动作,其中是范围在0-1之间设置的超参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学长三角研究院(衢州);浙江香满亭生物科技有限公司,其通讯地址为:324003 浙江省衢州市柯城区芹江东路288号1幢18楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。