深圳元始智能有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳元始智能有限公司申请的专利基于RWKV架构的端侧模型推理方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120725163B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511222402.0,技术领域涉及:G06N5/04;该发明授权基于RWKV架构的端侧模型推理方法、装置、电子设备及存储介质是由请求不公布姓名;季周然设计研发完成,并于2025-08-29向国家知识产权局提交的专利申请。
本基于RWKV架构的端侧模型推理方法、装置、电子设备及存储介质在说明书摘要公布了:本申请提出了一种基于RWKV架构的端侧模型推理方法、装置、电子设备及存储介质,包括:获取目标对象的目标输入请求,将目标输入请求转换为目标模型输入数据;在预设的状态存储空间中加载目标输入请求对应的历史推理状态;根据终端设备的硬件平台类型确定对应的RWKV核心算子;基于RWKV核心算子,对目标模型输入数据以及历史推理状态执行推理计算,得到输出令牌序列;其中,推理计算过程中,将大语言模型的实时推理状态保存在预设的状态加速器内存中进行复用;将输出令牌序列转换为文本格式并进行输出;根据推理计算后的实时推理状态更新历史推理状态。本申请能够针对RWKV架构的大语言模型进行计算优化和硬件加速,从而在端侧提高RWKV架构模型的推理性能。
本发明授权基于RWKV架构的端侧模型推理方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种基于RWKV架构的端侧模型推理方法,其特征在于,应用于预先部署有基于RWKV架构的大语言模型的终端设备中,所述方法包括: 获取目标对象的目标输入请求,将所述目标输入请求转换为目标模型输入数据; 在预设的状态存储空间中加载所述目标输入请求对应的历史推理状态; 根据所述终端设备的硬件平台类型确定对应的RWKV核心算子; 基于所述RWKV核心算子,对所述目标模型输入数据以及所述历史推理状态执行推理计算,得到输出令牌序列;其中,推理计算过程中,将大语言模型的实时推理状态保存在所述终端设备中预设的状态加速器内存中进行复用; 将所述输出令牌序列转换为文本格式并进行输出; 根据推理计算后的所述实时推理状态更新所述历史推理状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳元始智能有限公司,其通讯地址为:518000 广东省深圳市南山区蛇口街道渔一社区湾厦路126号南山互联网创新创意服务基地二期B408;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励