北京邮电大学王泉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利大语言模型生成文本持续溯源模型训练方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120179812B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510646849.4,技术领域涉及:G06F16/334;该发明授权大语言模型生成文本持续溯源模型训练方法及设备是由王泉;李浩然;徐楚欣阳;温烨谦设计研发完成,并于2025-05-20向国家知识产权局提交的专利申请。
本大语言模型生成文本持续溯源模型训练方法及设备在说明书摘要公布了:本申请提供大语言模型生成文本持续溯源模型训练方法及设备,涉及基于特定计算模型的计算机系统领域,方法包括:提取当前训练阶段的各个训练样本中的文本数据各自的特征向量,训练样本中还包含大语言模型所属类型的标签,当前训练阶段的大语言模型发布时间晚于历史训练阶段的模型发布时间,获取各个大语言模型的初始原型及文本特征相关性数据,对各个历史和当前训练阶段获取的初始原型进行全局及局部去相关处理,得到各个大语言模型各自的去相关原型以生成大语言模型生成文本持续溯源模型。本申请能够解决传统溯源方法因固定标签集导致的频繁重新训练的问题,能够有效提高模型训练效率并降低资源消耗,并能够提高溯源结果的可靠性及有效性。
本发明授权大语言模型生成文本持续溯源模型训练方法及设备在权利要求书中公布了:1.一种大语言模型生成文本持续溯源模型训练方法,其特征在于,包括: 阶段特征提取步骤:将本次模型训练过程中的当前训练阶段对应的数据集中的各个训练样本分别输入特征提取单元,以使该特征提取单元分别提取各个所述训练样本中的文本数据各自对应的特征向量;其中,每个所述训练样本中还包含有用于表示生成所述文本数据的大语言模型所属类型的标签;当前训练阶段对应的所述大语言模型的发布时间晚于各个历史训练阶段各自对应的大语言模型的发布时间;以及,根据各个所述文本数据各自的所述特征向量以及各个所述文本数据各自对应的所述标签,分别获取各个所述大语言模型各自的初始原型以及文本特征相关性数据; 若当前训练阶段为本次模型训练过程中的最后一个训练阶段,则根据各个所述历史训练阶段以及所述当前训练阶段依次获取的各个所述大语言模型各自的文本特征相关性数据,对各个所述历史训练阶段以及所述当前训练阶段依次获取的各个所述初始原型进行全局去相关处理及局部去相关处理,得到各个所述大语言模型各自对应的去相关原型,以基于当前的各个所述去相关原型以及包含有各个所述去相关原型各自对应的所述标签的标签组,生成用于预测生成文本数据的大语言模型所属类型且包含有所述特征提取单元的大语言模型生成文本持续溯源模型; 其中,所述根据各个所述文本数据各自的所述特征向量以及各个所述文本数据各自对应的所述标签,分别获取各个所述大语言模型各自的初始原型以及文本特征相关性数据,包括: 根据各个所述文本数据各自对应的所述标签,将同属于同一个所述大语言模型的各个所述文本数据各自的所述特征向量进行加和计算,以分别得到各个所述大语言模型各自的初始原型; 以及,根据各个所述文本数据各自对应的所述标签,将同属于同一个所述大语言模型的各个所述文本数据各自的所述特征向量进行格拉姆矩阵计算,以分别得到各个所述大语言模型各自对应的作为文本特征相关性数的格拉姆矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励