深圳市长亮科技股份有限公司王巍巍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市长亮科技股份有限公司申请的专利基于vllm部署的代码解读大模型参数调优方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120803872B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510959603.2,技术领域涉及:G06F11/34;该发明授权基于vllm部署的代码解读大模型参数调优方法是由王巍巍;邹伟杰设计研发完成,并于2025-07-11向国家知识产权局提交的专利申请。
本基于vllm部署的代码解读大模型参数调优方法在说明书摘要公布了:本发明提供了一种基于vllm部署的代码解读大模型参数调优方法,该方法由计算机实施,首先,结合论文的核心观点,进行实验组设计,设计基准实验组和实验对照组,用实验记录数据内容,得到实验结果,并结合数学分析,以对所得到的数据进行分析,然后,对疑似存在问题的数据进行排查和勘测,以得到依托vllm部署的代码解读大模型的最佳参数配置,能够结合论文的核心观点,设计合理的基准实验组和实验对照组,用实验记录数据内容,并结合数学分析,来得到依托vllm部署的代码解读大模型的最佳参数实践。本发明能确保在vllm上部署代码解读大模型的参数调优的结果有完整的证据链,在真实生产环境上有足够的信心来应用这些调优后的参数。
本发明授权基于vllm部署的代码解读大模型参数调优方法在权利要求书中公布了:1.一种基于vllm部署的代码解读大模型参数调优方法,该方法由计算机实施,其特征在于,首先,进行实验组设计,设计基准实验组和实验对照组,用实验记录数据内容,得到实验结果,并结合数学分析,以对所得到的数据进行分析,然后,对疑似存在问题的数据进行排查和勘测,通过设计多个追加实验组论证疑似错误数据,以得到依托vllm部署的代码解读大模型的最佳参数配置,其中,所述参数调优是针对影像prefill阶段和decode阶段性能参数,具体包括PrefixCaching和ChunkedPrefill;参数调优时有20个交易串行执行的方式,每个交易都调用一定数量的大模型,下一个交易等上一个交易处理完毕后再进行; 在所述实验组设计中,采用多张显卡,运行的模型采用微调后的qwen2-72b-instruct大语言模型,部署基于fastchat+vllm推理引擎,通过模型控制器controller,针对目标大模型推理集群中每个计算节点,确定推理请求发起位置、推理请求完成回复位置、首个token返回的位置和推理总时长,并计算非首个token平均耗时;评测首个Token的速率时,把max_new_token参数设为1,使得vllm只生成1个token;评测非首个token的速率时,通过fastchat客户端来进行token生成速率统计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市长亮科技股份有限公司,其通讯地址为:518063 广东省深圳市南山区粤海街道沙河西路深圳湾科技生态园一区2栋A座5层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励