Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浪潮云信息技术股份公司马雪敏获国家专利权

浪潮云信息技术股份公司马雪敏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浪潮云信息技术股份公司申请的专利一种大模型智能体的部署方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121116649B

龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511649014.0,技术领域涉及:G06F9/50;该发明授权一种大模型智能体的部署方法、装置、设备及介质是由马雪敏;韩同;唐晓东设计研发完成,并于2025-11-12向国家知识产权局提交的专利申请。

一种大模型智能体的部署方法、装置、设备及介质在说明书摘要公布了:本申请公开了一种大模型智能体的部署方法、装置、设备及介质,涉及人工智能技术领域,包括:在接收到智能体部署请求后,确定待部署大模型智能体的智能体配置信息,并确定目标大模型以及模型元数据;确定预设计算资源池的可用资源情况,并根据可用资源情况和模型元数据进行查询匹配,以确定若干硬件兼容的候选计算资源节点;针对待部署大模型智能体进行上线后的负载预测操作,以得到预测负载,并基于预测负载、预设调度策略、可用资源情况、候选计算资源节点生成目标部署决策方案;根据目标计算资源节点的资源特性对目标大模型的运行时参数进行调整,并在目标计算资源节点上加载调整后目标大模型,以部署并启动待部署大模型智能体的智能体实例。

本发明授权一种大模型智能体的部署方法、装置、设备及介质在权利要求书中公布了:1.一种大模型智能体的部署方法,其特征在于,包括: 在接收到智能体部署请求后,确定待部署大模型智能体的智能体配置信息,并根据所述智能体配置信息确定对应的目标大模型以及相应的模型元数据;所述智能体配置信息包括配置的预设调度策略;所述模型元数据包括每个模型版本所需的最低硬件规格、推荐硬件规格、模型文件大小、推理时内存占用估计; 确定预设计算资源池的可用资源情况,并根据所述可用资源情况和所述模型元数据对所述预设计算资源池进行查询匹配,以确定若干硬件兼容的候选计算资源节点; 针对所述待部署大模型智能体进行上线后的负载预测操作,以得到相应的预测负载,并基于所述预测负载、所述预设调度策略、所述可用资源情况、所述候选计算资源节点生成目标部署决策方案;所述目标部署决策方案中包括从所述候选计算资源节点中确定出的目标计算资源节点; 根据所述目标计算资源节点的资源特性对所述目标大模型的运行时参数进行调整,以得到调整后目标大模型,并根据所述目标部署决策方案,在所述目标计算资源节点上加载所述调整后目标大模型,以部署并启动所述待部署大模型智能体的智能体实例; 其中,所述根据所述目标计算资源节点的资源特性对所述目标大模型的运行时参数进行调整,包括: 确定所述模型元数据中的模型显存需求数据,并确定所述目标计算资源节点的可用显存数据; 利用所述模型显存需求数据和所述可用显存数据计算预设显存占用公式,以量化所述目标大模型和所述目标计算资源节点的硬件兼容性,得到相应的量化结果; 根据所述量化结果对所述目标大模型的批处理大小进行调整。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云信息技术股份公司,其通讯地址为:250101 山东省济南市高新区浪潮路1036号浪潮科技园T03号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。