Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国铁道科学研究院集团有限公司科学技术信息研究所;中国国家铁路集团有限公司;中国铁道科学研究院集团有限公司王荣笙获国家专利权

中国铁道科学研究院集团有限公司科学技术信息研究所;中国国家铁路集团有限公司;中国铁道科学研究院集团有限公司王荣笙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国铁道科学研究院集团有限公司科学技术信息研究所;中国国家铁路集团有限公司;中国铁道科学研究院集团有限公司申请的专利一种垂直领域大语言模型的构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119719256B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411260648.2,技术领域涉及:G06F16/332;该发明授权一种垂直领域大语言模型的构建方法及系统是由王荣笙;葛建明;王晓刚;翟夏普;王宁;王东晋;龚云基;龙艺璇;杨苗苗;范继斌;李子龙设计研发完成,并于2024-09-10向国家知识产权局提交的专利申请。

一种垂直领域大语言模型的构建方法及系统在说明书摘要公布了:本发明提供了一种垂直领域大语言模型的构建方法及系统,涉及自然语言处理技术领域,包括通过数据预处理和分类模型提取垂直领域数据的主题词信息,并应用强化学习训练大模型以提升其专业化能力。进一步,基于预处理数据和主题词信息生成垂直领域知识库,并利用启发式编码方法优化信息检索。最后,部署训练后的大模型和知识库,并构建应用程序接口,实现智能化服务。本发明通过综合利用预处理、分类、强化学习和知识编码技术,有效解决通用大模型在专业领域应用中的相关性和精度问题,推动人工智能在垂直领域的实际应用和发展。

本发明授权一种垂直领域大语言模型的构建方法及系统在权利要求书中公布了:1.一种垂直领域大语言模型的构建方法,其特征在于,包括: 获取待处理的数据信息,所述待处理的数据信息包括至少一个数据源的垂直数据信息; 将所述待处理的数据信息发送至预设的数据预处理模型进行预处理,得到预处理后的数据信息; 将预处理后的数据信息按照发送至预设的分类模型进行主题词分类,得到至少两个类别的数据的主题词信息; 将所有类别的数据的主题词信息发送至预设的垂直领域大模型进行强化学习训练,并调整所述垂直领域大模型的神经网络结构及权重参数,得到训练后的垂直领域大模型; 基于预处理后的数据信息和所有类别的数据的主题词信息生成垂直领域知识库,并基于预设的启发式方法进行对所有类别的数据的主题词信息进行编码,得到垂直领域大模型的提示词模版; 基于预设部署方案部署训练后的垂直领域大模型和垂直领域知识库,并构建训练后的垂直领域大模型的应用程序接口,得到部署完成的垂直领域大模型; 其中,将预处理后的数据信息按照发送至预设的分类模型进行主题词分类,包括: 将所述预处理后的数据信息进行检索,其中,检索预处理后的数据信息中是否具备预设的词汇信息,若有,则将所述预设的词汇信息进行删除,得到删除预设词汇信息的数据信息; 基于词频分析法对删除预设词汇信息的数据信息进行关键词分析,确定删除预设词汇信息的数据信息中出现频率大于预设阈值的词汇信息,并将其作为关键词; 调用所有的待处理的数据信息中预设的每个数据对应的技术方向,将每个技术方向分别与每个所述关键词按照预设的距离计算公式进行距离计算,其中,若所述距离小于预设的阈值,则将所述关键词划分至其对应的技术方向的类别; 其中,将所有类别的数据的主题词信息发送至预设的垂直领域大模型进行强化学习训练,并调整所述垂直领域大模型的神经网络结构及权重参数,得到训练后的垂直领域大模型,包括: 基于所述关键词及其对应的技术方向类别构建垂直领域知识树结构,其中,垂直领域知识树结构的一级节点为技术方向,二级节点为关键词; 将所述垂直领域知识树结构作为训练数据集输入至预设的垂直领域大模型进行训练,其中,初始化垂直领域大模型的原始权重矩阵,基于原始权重矩阵和预设的权重矩阵调整公式确定第一调整权重矩阵; 基于强化学习法对第一调整权重矩阵进行训练计算,直至所述第一调整权重矩阵达到预设阈值,得到第二调整权重矩阵,所述第二调整权重矩阵为通过强化学习法调整后的第一调整权重矩阵; 基于第二调整权重矩阵对预设的垂直领域大模型中的多头自注意力和前馈神经网络部分进行调整,得到训练后垂直领域大模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国铁道科学研究院集团有限公司科学技术信息研究所;中国国家铁路集团有限公司;中国铁道科学研究院集团有限公司,其通讯地址为:100081 北京市海淀区大柳树路2号一区15幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。