南京龟兔赛跑软件研究院有限公司;青海数农科技有限公司毛霖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京龟兔赛跑软件研究院有限公司;青海数农科技有限公司申请的专利基于反馈及强化的模型微调方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120562523B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511063207.8,技术领域涉及:G06N3/096;该发明授权基于反馈及强化的模型微调方法及系统是由毛霖;张帆;姬鹏飞;陈海军;齐佰剑;杨庆庆设计研发完成,并于2025-07-31向国家知识产权局提交的专利申请。
本基于反馈及强化的模型微调方法及系统在说明书摘要公布了:本申请提供了基于反馈及强化的模型微调方法及系统,涉及自然语言处理技术领域,方法包括:获取语言模型生成的输出文本并进行嵌入编码;识别文本中结构性语义单元,生成结构标记信息;基于结构标记信息构建低层胶囊集合,执行动态路由生成高层语义胶囊集合;依据高层语义胶囊集合与结构标记的映射关系构建结构表达矩阵;将该矩阵输入奖励评分模型生成强化学习回报值,并据此更新语言模型参数。该方法实现了语言模型结构感知能力与策略优化路径的闭环联动,可在无需人工标注的条件下提升文本生成结构性与语义一致性。
本发明授权基于反馈及强化的模型微调方法及系统在权利要求书中公布了:1.基于反馈及强化的模型微调方法,其特征在于,包括: 获取语言模型在预设输入下生成的目标输出文本,并对所述目标输出文本进行嵌入编码,得到第一特征向量序列; 基于所述第一特征向量序列,生成与所述目标输出文本中结构性语义单元对应的第一结构标记信息;其中,所述第一结构标记信息包括:伪语义节点、扰动锚点以及语义偏移码; 基于所述第一特征向量序列和所述第一结构标记信息,构建第一低层胶囊集合,并对所述第一低层胶囊集合进行动态路由,计算得到对应的第一高层语义胶囊集合; 根据所述第一高层语义胶囊集合中各高层语义胶囊与所述第一结构标记信息之间的映射关系,生成用于表征所述目标输出文本结构依存情况的第一结构表达矩阵; 将所述第一结构表达矩阵输入至奖励评分模型,基于所述第一结构表达矩阵及所述第一结构标记信息,生成与所述目标输出文本对应的第一奖励得分;将所述第一奖励得分作为当前轮强化学习策略优化中的第一回报值,输入至策略更新模块,以更新所述语言模型的参数; 所述对所述目标输出文本进行嵌入编码,得到第一特征向量序列包括: 将所述目标输出文本划分为多个语言单元; 对每个语言单元在执行嵌入映射之前,注入对应的结构引导向量,所述结构引导向量用于表征候选伪语义节点、扰动锚点以及语义偏移码的初始定位信息; 基于预设的嵌入映射模型对注入结构引导向量的语言单元进行编码,生成嵌入向量集合; 对所述嵌入向量集合执行上下文聚合操作,得到所述第一特征向量序列; 所述基于所述第一特征向量序列,生成与所述目标输出文本中结构性语义单元对应的第一结构标记信息包括: 基于所述初始定位信息,得到第一定位参考集合;所述第一定位参考集合用于表征目标输出文本中各结构性语义单元的初始候选位置范围; 从所述第一特征向量序列中提取与所述第一定位参考集合中每个初始候选位置对应的候选向量点,生成第一候选标记集合; 针对所述第一候选标记集合中的每个候选向量点,基于所述候选向量点与其预设上下文窗口内的相邻特征向量,计算对应的语义差异性指标;所述语义差异性指标用于表征候选向量点与其上下文之间的语义边界强度; 筛选所述语义差异性指标满足预设阈值条件的候选向量点,作为所述第一结构标记信息的目标标记位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京龟兔赛跑软件研究院有限公司;青海数农科技有限公司,其通讯地址为:211000 江苏省南京市雨花台区安德门大街57号7幢8层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励