杭州轻寻科技有限公司刘悬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州轻寻科技有限公司申请的专利基于强化学习的LLM输出稳定性控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120804310B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511315610.5,技术领域涉及:G06F16/34;该发明授权基于强化学习的LLM输出稳定性控制方法及系统是由刘悬;李海亮;曾禹航;范军设计研发完成,并于2025-09-15向国家知识产权局提交的专利申请。
本基于强化学习的LLM输出稳定性控制方法及系统在说明书摘要公布了:本发明提供基于强化学习的LLM输出稳定性控制方法及系统,所述方法包括:对文献数据进行多模态结构化解析,提取内容单元并构建特征向量集合和关联映射表;并行驱动文本逻辑处理模块和视觉语义处理模块对跨模态任务单元解读,构建初始摘要集合;在跨模态一致性奖励驱动的迭代闭环中,根据当前联合状态构建联合动作,由跨模态一致性仲裁器计算奖励信号并构建近端策略优化算更新策略网络,直至奖励信号收敛;基于关联映射表,驱动序列到序列语言模型对最终联合状态集合的最终文本摘要和信息描述集合重构,生成最终摘要。本发明通过结构化解析与多模态协同控制,确保摘要内容的一致性与稳定性,适用于自然语言处理与强化学习领域。
本发明授权基于强化学习的LLM输出稳定性控制方法及系统在权利要求书中公布了:1.基于强化学习的LLM输出稳定性控制方法,其特征在于,包括: 对非结构化的文献数据执行页面布局分析以分割并提取多模态内容区域,将所述内容区域转换为内容单元集合,对所述内容单元集合中各内容单元进行特征向量化以生成特征向量集合,并构建所述各内容单元间的跨模态关联映射以构建关联映射表,将所述文献数据转换为包含内容单元集合、特征向量集合及关联映射表的跨模态文献数据集; 依据关联映射表将各非文本单元形成文本上下文集合以构建跨模态任务单元集合,并行驱动文本逻辑处理模块和视觉语义处理模块对所述各跨模态任务单元进行初步解读,分别输出初始文本摘要和初始信息描述集合,将所述两个模块的输出进行聚合,构建初始摘要集合; 启动由跨模态一致性奖励驱动的迭代闭环,根据当前联合状态构建联合动作,依据所述联合状态由跨模态一致性仲裁器计算奖励信号,基于所述奖励信号构建近端策略优化算法以更新文本逻辑处理模块和视觉语义处理模块两个模块的策略网络,完成状态更新并依据所述奖励信号的收敛情况判断是否终止所述闭环; 对最终联合状态集合进行解构以分离出最终文本摘要集合和最终信息描述集合,以关联映射表为结构化指导,驱动序列到序列语言模型对所述两个分离后的集合进行融合重构,生成最终摘要。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州轻寻科技有限公司,其通讯地址为:311121 浙江省杭州市余杭区五常街道文一西路998号4幢512室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励