上海光羽芯辰科技有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海光羽芯辰科技有限公司申请的专利大模型的数据处理方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121029652B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511046957.4,技术领域涉及:G06F13/28;该发明授权大模型的数据处理方法、装置、设备及介质是由请求不公布姓名;请求不公布姓名设计研发完成,并于2025-07-29向国家知识产权局提交的专利申请。
本大模型的数据处理方法、装置、设备及介质在说明书摘要公布了:本发明提供一种大模型的数据处理方法、装置、设备及介质,应用于芯片,所述芯片包括PNM、SIP和DMA,所述SIP和所述PNM之间设置有生产者‑消费者模型,且两者动态交替扮演生产者和消费者。本发明通过DMA负责从外部存储器加载数据到共享缓存;在大模型的预填充阶段和生成阶段,计算任务被分配给PNM和SIP两个单元;PNM和SIP之间动态交替扮演生产者和消费者的角色;通过这种协同工作方式,充分利用了芯片的计算资源,提高了处理效率和吞吐量。从而在大模型的端侧应用中,能够有效协调PNM、SIP和DMA之间的协同工作,解决存储带宽和容量问题,提高模型的推理效率和性能。
本发明授权大模型的数据处理方法、装置、设备及介质在权利要求书中公布了:1.一种大模型的数据处理方法,其特征在于,应用于芯片,所述芯片包括PNM、SIP和DMA,所述SIP和所述PNM之间设置有生产者-消费者模型,且两者动态交替扮演生产者和消费者,所述方法包括: DMA从外部存储器加载模型参数和初始数据到共享缓存; 在预填充阶段中,PNM从HBM中获取输入序列的每个token对应的查询向量、键向量和值向量,并对所述键向量和所述值向量进行数据类型的转换处理,获得转换后的键向量、转换后的值向量,以及将所述转换后的键向量和所述转换后的值向量放在所述HBM中或所述共享缓存中;SIP对每个token对应的查询向量、转换后的键向量以及转换后的值向量执行注意力计算,生成每个token更新后的上下文表示;SIP从所述HBM中获取输出层权重,并对所述输出层权重和所述上下文表示执行矩阵乘法计算,得到每个token的输出表示; 在生成阶段,PNM从所述HBM中获取当前输入token对应的当前查询向量、当前键向量和当前值向量,并对所述当前查询向量与所述当前键向量执行矩阵乘法计算,得到注意力分数;SIP对所述注意力分数执行旋转位置编码处理,得到编码后的注意力分数;PNM对所述编码后的注意力分数与当前值向量执行矩阵乘法计算,得到当前输入token的上下文向量;SIP对所述当前输入token的上下文向量执行softmax计算,得到概率权重向量;SIP从所述HBM中获取输出层权重,并对所述输出层权重与所述概率权重向量执行矩阵乘法计算,得到当前输入token的推理结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海光羽芯辰科技有限公司,其通讯地址为:201400 上海市奉贤区川南奉公路9222号1幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励