苏州元脑智能科技有限公司温东超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利网络模型量化方法、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721144B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510222574.1,技术领域涉及:G06N3/0495;该发明授权网络模型量化方法、设备、存储介质及程序产品是由温东超;梁玲燕设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。
本网络模型量化方法、设备、存储介质及程序产品在说明书摘要公布了:本申请公开了一种网络模型量化方法、设备、存储介质及程序产品,涉及数据处理技术领域,包括:将待量化模块中的待量化矩阵进行分块以细分,获得分块矩阵,计算出各分块矩阵对应的分块重要度以及量化阈值,分块重要度体现出各自对应的分块矩阵在对应的待量化模块中的重要性,量化阈值是基于分块重要度计算出的,所以不同的待量化模块所对应的量化阈值不同,进而提高了量化阈值的灵活性,本申请中考虑了各待量化模块的不同点;基于各分块重要度以及量化阈值对各分块矩阵进行量化,所以对各分块矩阵进行量化时,是从分块矩阵上做的量化,而不是以待量化矩阵为单位进行量化,所以本申请在量化时更为细化,使得得到的量化后模型更为准确。
本发明授权网络模型量化方法、设备、存储介质及程序产品在权利要求书中公布了:1.一种网络模型量化方法,其特征在于,包括: 将待量化模块包含的待量化矩阵进行分块,以获得多个分块矩阵;所述待量化模块来源于待量化模型;所述待量化模块为至少一个; 针对各待量化模块,将训练数据集输入至所述待量化模型中,经过神经网络向前传播,以获得各待量化模块对应的中间数据;所述中间数据的数量与所述训练数据的数量相等; 基于各所述中间数据构建各待量化模块对应的输入数据; 将所述输入数据输入至预设二阶导数算法中,以输出二阶矩阵; 针对各分块矩阵,基于所述二阶矩阵计算所述分块矩阵各行元素对应的平均重要度;所述平均重要度为所述分块矩阵中对应的行元素重要度的平均值; 针对各分块矩阵,基于对应的所述平均重要度计算各所述分块矩阵对应的分块重要度;各所述分块矩阵对应的分块重要度表征各所述分块矩阵对所述待量化模块性能的影响程度; 基于各所述分块重要度中最大的分块重要度,计算所述待量化模块对应的量化阈值,所述训练数据集包括至少一个训练数据; 针对各所述分块矩阵响应于所述分块矩阵的分块重要度小于或等于所述量化阈值,采用预设第一量化算法对所述分块矩阵分块量化,以获得所述分块矩阵对应的分块量化矩阵;响应于所述分块矩阵的分块重要度大于所述量化阈值,采用预设第二量化算法以及预设量化次数对所述分块矩阵分块量化,以获得所述分块矩阵对应的分块量化矩阵;所述预设第一量化算法的量化程度小于所述预设第二量化算法的量化程度; 基于各所述分块量化矩阵生成对应的待量化模块量化后的量化权重矩阵; 针对各待量化模块,将所述待量化模块中的待量化矩阵替换为对应的量化权重矩阵,以获得各所述待量化模块对应的量化后模块,并基于各所述量化后模块生成量化后模型; 将查询文本输入至文本编码模块中,以输出所述查询文本对应的文本特征;所述文本编码模块来源于量化后模型;所述文本编码模块包括至少一个量化后模块; 基于所述文本特征在图像特征数据库中检索,以获得与所述查询文本对应的目标图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215000 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励