Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 清华大学赵彤获国家专利权

清华大学赵彤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉清华大学申请的专利一种工艺知识图谱的构建方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119539065B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411425590.2,技术领域涉及:G06N5/025;该发明授权一种工艺知识图谱的构建方法、装置及存储介质是由赵彤;郭克;宫傲;张大舜;叶佩青设计研发完成,并于2024-10-13向国家知识产权局提交的专利申请。

一种工艺知识图谱的构建方法、装置及存储介质在说明书摘要公布了:本发明提供的一种工艺知识图谱的构建方法,包括:获取原始工艺数据,并结合工艺生产领域的专家知识建立工艺领域词典,基于该词典对结构化原始工艺数据和非结构化原始工艺数据分别进行预处理,得到规范工艺数据;对该规范工艺数据按照工件数据、特征数据、工艺设备数据、工艺方法数据、材料特性数据、以及工艺历史与经验数据6个维度进行分类,以此建立工艺知识图谱的本体模型并形成工艺知识图谱的模式层;将各类规范工艺数据输入预训练的深度学习模型,以识别并抽取实体及其关系,从而构建工艺知识图谱的数据层;将模式层和数据层整合,形成完整的工艺知识图谱。本发明构建的工艺知识图谱适用的工艺范围广且智能化程度高。

本发明授权一种工艺知识图谱的构建方法、装置及存储介质在权利要求书中公布了:1.一种工艺知识图谱的构建方法,其特征在于,包括: 步骤S1、获取原始工艺数据,并结合工艺生产领域的专家知识建立工艺领域词典,基于所述工艺领域词典对结构化原始工艺数据和非结构化原始工艺数据分别进行预处理,得到规范工艺数据; 步骤S2、对所述规范工艺数据按照工件数据、特征数据、工艺设备数据、工艺方法数据、材料特性数据、以及工艺历史与经验数据6个维度进行分类,以此建立工艺知识图谱的本体模型并形成工艺知识图谱的模式层; 步骤S3、将各类规范工艺数据输入预训练的深度学习模型,以识别并抽取实体及其关系,从而构建工艺知识图谱的数据层; 步骤S4、将所述模式层和数据层整合,通过映射关系,将各类规范工艺数据填充至所述模式层定义的结构中,构建实体间的关系网络,从而形成完整的工艺知识图谱; 所述原始工艺数据包括零件加工特征、材料信息、工艺要求和设备参数;所述零件加工特征包括待加工机械零件的几何形状、尺寸公差和表面粗糙度的具体要求;所述材料信息涉及零件所使用材料的物理和化学特性;所述工艺要求包含加工过程中的操作条件,包括工艺路线、加工步骤和使用的刀具;所述设备参数包括设备的类型、规格和加工精度; 利用所述非结构化原始工艺数据并结合人工标注和专家知识建立所述工艺领域词典,同时对所述工艺领域词典中的词条按照不同实体类型分类,所述工艺领域词典需定期更新; 针对结构化原始工艺数据进行的预处理,具体包括:数据清洗,去除重复或无关的记录,修正错误信息,填补缺失值,确保数据的完整性和准确性;对不同来源的数据进行格式标准化处理,统一不同来源的数据格式,在此过程中,利用所述工艺领域词典核对和统一数据中使用的术语;对数值型数据进行归一化,以消除不同量纲带来的影响; 针对非结构化工艺数据进行的预处理,具体包括:采用自然语言处理方法并结合所述工艺领域词典对原始工艺数据的文本进行分词处理;对分词后的文本进行词性标注;结合所述工艺领域词典对词性标注后的文本进行正则化处理,确保文本中术语的一致性;对正则化处理后的文本进行停用词过滤处理; 所述工件数据包括工件的基本信息,具体为:工件的名称、编号、几何特征和材料;所述特征数据描述了工件的加工特征;所述工艺设备数据涉及产品制造所需的设备类型和规格;所述工艺方法数据是指毛坯到最终产品所经历的各个步骤,具体包括各项工序和工步;所述材料特性数据描述工艺中使用的材料种类、物理与化学特性参数;所述工艺历史与经验数据是历史生产过程中积累的经验数据; 步骤S3中,所述预训练的深度学习模型通过以下步骤得到: 步骤S31、数据集构建: 采用BIO标注法对步骤S2分类好的每一条规范工艺数据进行标注,其中“B”表示实体的开始,“I”表示实体的内部,和“O”表示非实体,需要标注的类别包括材料、工艺步骤和设备,得到含有BIO标签信息的规范工艺数据; 将含有BIO标签信息的每一条规范工艺数据分别作为一个样本,统计每个类别含有的样本数量,得到类别比例,由所有样本构建数据集,各样本在所述数据集内随机排布;根据所述类别比例对所述数据集内的各样本进行分层抽样,并将所述数据集按照比例划分为训练子集、验证子集和测试子集,抽样时应确保各子集中每个类别的样本比例与整体数据集中每个类别的样本比例一致或相似; 步骤S32、模型构建: 构建基于深度学习的BERT-BiLSTM-CRF模型,所述BERT-BiLSTM-CRF模型依次连接的BERT网络、BiLSTM网络和CRF网络组成; 所述BERT网络包括依次连接的分词器、若干依次交替设置的Transformer层和归一化层、以及激活函数层,所述BERT网络用于将输入的样本转换为上下文丰富的词向量; 所述BiLSTM网络用于对所述BERT网络输出的词向量进行处理,生成上下文表示向量; 所述CRF网络用于对所述BiLSTM网络输出的上下文表示向量进行分析,确定不同样本中词语的BIO标签之间的依赖关系,实现对样本中词语的BIO标签的预测; 步骤S33、模型训练: 设置训练参数,包括学习率、批量大小、训练轮次、监控指标和损失函数,并利用所述训练子集对构建的BERT-BiLSTM-CRF模型进行训练; 步骤S34、模型验证: 利用所述验证子集对经步骤S33训练得到的BERT-BiLSTM-CRF模型进行验证,以评估模型的训练效果,将满足验证条件的模型作为所述预训练的深度学习模型; 将所述测试子集输入至所述预训练的深度学习模型中,识别抽取输入样本中的关键实体及其关系,由此组成工艺知识图谱的数据层; 所述BERT网络中设有12个Transformer层,每个Transformer层均分别包含12个多头自注意力机制,采用GeLU作为激活函数;所述BiLSTM网络的层数为一层;所述监控指标包括F1分数、准确率和召回率;所述损失函数采用负对数似然函数; 步骤S4具体包括: 将由步骤S3提取到的每个实体根据步骤S2建立的工艺知识图谱的本体模型中的分类规则映射到工艺知识图谱的相应节点,同时,识别出的关系会依据本体模型的规则进行映射到工艺知识图谱的相应节点,再将提取到的关系映射到工艺知识图谱中的边,用以定义不同实体之间的关联,从而形成一个完整的实体网络,即得到完整的工艺知识图谱。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。