北京泰和观复科技有限公司刘文博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京泰和观复科技有限公司申请的专利一种基于大语言模型的文本处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120104781B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510099874.5,技术领域涉及:G06F16/335;该发明授权一种基于大语言模型的文本处理方法及系统是由刘文博;郑鉴涛;蒋文杰;唐逸设计研发完成,并于2025-01-22向国家知识产权局提交的专利申请。
本一种基于大语言模型的文本处理方法及系统在说明书摘要公布了:本发明公开了一种基于大语言模型的文本处理方法及系统,涉及计算机技术领域,包括,收集文本数据,并通过数据增强技术生成变体样本,得到预训练数据集,引入知识图谱,输出训练后的大语言模型;利用自适应任务选择器、增量式学习框架和元学习算法,进行超参数优化;考虑非文本数据,利用多模态模型来捕捉不同类型的上下文线索,并利用跨文化认知框架理解表达方式;基于更新后的大语言模型,建立置信度评估方法,并输出高置信度文本处理结果;根据高置信度文本处理结果,构建个性化的用户画像,优化推荐内容;本发明通过引入多模态模型和跨文化认知框架,有效提升了大语言模型在处理复杂现实世界问题时的表现。
本发明授权一种基于大语言模型的文本处理方法及系统在权利要求书中公布了:1.一种基于大语言模型的文本处理方法,其特征在于:包括, 收集文本数据,并通过数据增强技术生成变体样本,得到预训练数据集,引入知识图谱,输出训练后的大语言模型; 采用自适应任务选择器,将预训练数据集自动匹配下游任务类型,同时,利用增量式学习框架和元学习算法,进行超参数优化; 考虑非文本数据,利用多模态模型来捕捉不同类型的上下文线索,并利用跨文化认知框架理解表达方式; 基于更新后的大语言模型,建立置信度评估方法,并输出高置信度文本处理结果; 根据高置信度文本处理结果,构建个性化的用户画像,优化推荐内容; 收集文本数据,并通过数据增强技术生成变体样本,得到预训练数据集,引入知识图谱,输出训练后的大语言模型,包括如下步骤, 确定目标领域,并识别目标领域内的主要信息源; 使用爬虫技术访问选定的主要信息源,下载文本数据; 使用同义词替换、句子重组和上下文扩展的方法,得到变体样本; 整合文本数据和变体样本,生成预训练数据集; 分析各类文化特有的表达习惯、隐喻和俚语,形成文化特征标签库,利用双语对照构建平行语料库; 应用BERT-basedNER模型,自动识别文本中的实体,并标注实体类型; 通过依存句法分析,解析句子的语法结构,找出实体间的潜在关系; 利用TransE算法优化三元组表示,将实体和关系映射到低维向量空间; 当实体和关系捕捉失败时,重新进行文本数据收集及分析; 当实体和关系捕捉成功时,根据捕捉的实体和关系构建知识图谱,训练大语言模型,得到训练后的大语言模型; 采用自适应任务选择器,将预训练数据集自动匹配下游任务类型,同时,利用增量式学习框架和元学习算法,进行超参数优化,包括如下步骤, 定义下游任务类型,并对每种任务类型定义特征集合和评价指标; 使用元学习算法,基于定义的下游任务类型,训练自适应任务选择器,输入预训练数据集,输出预测的下游任务类型及超参数配置建议; 定期从信息源获取最新的文本数据,经过清洗和标注处理后加入到平行语料库中,将其与历史文本数据合并,形成新的预训练数据集,并使用小批量梯度下降的优化方法结合预测结果,对训练后的大语言模型的部分超参数进行更新; 考虑非文本数据,利用多模态模型来捕捉不同类型的上下文线索,并利用跨文化认知框架理解表达方式,包括如下步骤, 收集与目标领域相关联的非文本数据; 使用多模态深度学习架构,将文本数据与非文本数据投影到相同维度,在统一的向量空间内进行共同表示,形成多模态数据; 将多模态数据与文本数据配对,形成联合训练样本,使用端到端的方式同时训练文本编码器和其他模态的编码器; 采用条件随机场技术,在大语言模型中添加跨文化适应层,对输入文本进行文化敏感性分析,识别涉及的文化特征; 使用来自多种语言和文化的平行语料库进行预训练,让大语言模型初步掌握不同文化的表达方式,得到更新后的大语言模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京泰和观复科技有限公司,其通讯地址为:100000 北京市石景山区古城西街26号院1号楼4层406;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。