浙江工业大学胡亚红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利基于深度强化学习的面向创新设计的功能知识集成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116431819B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310202577.X,技术领域涉及:G06F16/36;该发明授权基于深度强化学习的面向创新设计的功能知识集成方法是由胡亚红;蓝翔设计研发完成,并于2023-03-06向国家知识产权局提交的专利申请。
本基于深度强化学习的面向创新设计的功能知识集成方法在说明书摘要公布了:基于深度强化学习的面向创新设计的功能知识集成方法,包括:1将离散的功能知识单元依托其输入输出间的匹配关系构建为功能知识图谱;2将功能知识集成的核心任务——功能单元链生成建模为马尔科夫决策过程,并采用强化学习中的深度蒙特卡洛算法进行求解;3通过自动或半自动迭代框架将强化学习算法生成的阶段性方案功能单元链合并为最终设计方案。根据用户对目标产品功能的结构化语义描述,本发明能以几乎实时的速度输出最具功能完备性的设计方案,保证方案质量的同时,极大降低了大规模知识库下功能知识集成所需的时间成本。
本发明授权基于深度强化学习的面向创新设计的功能知识集成方法在权利要求书中公布了:1.基于深度强化学习的面向创新设计的功能知识集成方法,包括以下步骤: 1将离散的功能知识单元依托其输入输出间的匹配关系构建为功能知识图谱; 2将功能知识集成的核心任务——功能单元链生成建模为马尔科夫决策过程,并采用强化学习中的深度蒙特卡洛算法进行求解;具体包括: 2.1将目标功能表示为FKG中两个虚拟的结点和,前者仅包含输出属性,后者仅包含输入属性;那么,FKI任务被定义为在FKG中寻找一条从到的完全匹配的路径,即路径中功能单元间的冗余数之和为0;进一步利用动态规划的思想,复杂的FKI任务被转化为每次搜索一条从到的部分匹配路径,即功能单元链,之后将未匹配的输入输出作为新目标功能并搜索其功能单元链的迭代方式,逐步完成所有输入输出的匹配; 2.2将路径中的冗余数之和作为功能单元链的评价指标,称为全局冗余度;通过对该指标最优化,既能保证所得方案的功能完备性,又能控制算法所需的迭代次数至合理的范围内; 2.3将FKI任务建模为马尔科夫决策过程,其中每个时间步的行为对应路径搜索过程中的一个后继结点的选择; 2.4构建价值网络Q-network用于对从目标输入结点开始的所有后继结点的决策;网络包含卷积和LSTM两个特征提取模块,以及一个MLP预测模块;接收当前结点、邻接结点、当前结点与其后继结点之间的冗余数、行为轨迹、全局冗余数以及目标功能需求七大信息为输入,输出每个后继结点的预期回报值Q-value; 2.5奖励用于对智能体的行为进行引导;定义成功、失败、过程以及碰壁四个奖励函数,分别对智能体成功到达目标输出结点、达到最大搜索长度仍未到达最终结点、处在中间结点、处在无后继结点的中间四种情景状态给予反馈;其中失败奖励为基于健康导向假说的非零奖励,使智能体在搜索失败时同样能学习如何进行健康搜索;该奖励能很好的提升算法收敛速度以及收敛性能; 2.6使用Every-visitMonte-Carlo算法对价值网络进行训练;定义目标策略为贪婪策略,行为策略为基于epsilon贪婪策略改进的,epsilon值随训练过程递减的区间epsilon贪婪策略; 3通过自动或半自动迭代框架将强化学习算法生成的功能单元链合并为最终设计方案;实现以用户对目标功能的结构化语义描述为输入,相应功能设计方案为输出的高效FKI框架。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励