Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 青岛道可云网络科技有限公司丁兆龙获国家专利权

青岛道可云网络科技有限公司丁兆龙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉青岛道可云网络科技有限公司申请的专利一种基于RAG技术的人工智能体生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118551026B

龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411025770.1,技术领域涉及:G06F16/3329;该发明授权一种基于RAG技术的人工智能体生成方法及系统是由丁兆龙;徐凯;孙即林设计研发完成,并于2024-07-30向国家知识产权局提交的专利申请。

一种基于RAG技术的人工智能体生成方法及系统在说明书摘要公布了:本发明属于文件数据处理技术领域,公开了一种基于RAG技术的人工智能体生成方法及系统。该方法创建知识库,利用绑定的向量模型与文档处理模型检索相关文档并生成回答或文本,所述文档处理模型负责对文档库进行预处理和向量化,向量模型处理用户输入的查询,并将所述查询转化为向量表示;向所述知识库导入数据,按照数据导入的时间顺序排队转成向量化的数值;创建机器人应用,关联知识库;发布机器人应用,进行聊天。本发明针对RAG技术缺陷与不足,解决了人员实施RAG技术难的问题、内容缺失的问题、错过排名靠前文档的问题以及处理非结构化文档困难的问题。

本发明授权一种基于RAG技术的人工智能体生成方法及系统在权利要求书中公布了:1.一种基于RAG技术的人工智能体生成方法,其特征在于,该方法结合语言模型与信息检索技术,通过优化向量模型和文档处理模型的联合训练,有效提高了文本生成的准确性和信息检索的效率,同时解决处理非结构化文档和数据排名问题,显著提升系统的实用性和用户体验,具体包括: S1,创建知识库,利用绑定的向量模型与文档处理模型检索相关文档并生成回答或文本,所述文档处理模型负责对文档库进行预处理和向量化,向量模型处理用户输入的查询,并将所述查询转化为向量表示; S2,向所述知识库导入数据,按照数据导入的时间顺序排队转成向量化的数值; S3,创建机器人应用,关联知识库; S4,发布机器人应用,进行聊天; S5,对机器人问答数据进行数据修正,使机器人能够提供更精准的问答; 在步骤S1中,创建知识库,包括: 1选择语言模型,首先,选择一个预训练的语言模型,包括 BERT或者其变种,作为向量化的基础模型;该向量化的基础模型经过大规模的文本语料训练,将文本编码为密集的向量表示,捕捉文本的语义和语境信息; 将查询向量与文档向量进行匹配,获取更精确的相似度度量,能够学习到更高级别的语义; 2文本预处理,对输入的查询和文档进行预处理,包括清洗文本、分词、去除停用词操作; 3向量化转换,使用选定的语言模型对经过预处理的文本进行编码;具体步骤如下: 分词Tokenization,将文本分割成词语或子词,形成token序列; 嵌入Embedding,将每个token转换为对应的向量表示;这些向量是预训练模型学习到的词嵌入,反映词语在语义空间中的位置; 池化Pooling或序列表示,对token的嵌入进行聚合操作,生成整个查询或文档的单一向量表示;池化策略包括平均池化或使用 [CLS]标记的序列嵌入; 4相似度计算,一旦查询和文档都被转换为向量表示,使用向量空间模型中的基于注意力机制的相似度计算方法衡量它们在语义空间中的相似程度; 利用向量空间模型生成的查询向量和文档向量,系统计算查询和各文档之间的相似度;通过相似度计算,系统从文档库中检索出与查询最相关的N个文档; 步骤4相似度计算中,基于注意力机制的相似度计算方法采用Transformer模型中的自注意力机制,用于捕捉查询和文档之间的语义关系; 步骤4相似度计算中,考虑文本的局部和全局信息,在计算相似度时,结合局部和全局信息,使用卷积神经网络CNN、长短期记忆网络LSTM捕捉文本的局部特征,然后与全局的Transformer模型进行整合,以获得更全面的语义表达和相似度评估; 步骤4相似度计算中,通过集成知识增强技术,将外部知识图谱或专业领域知识引入相似度计算过程中;这些知识源为文档和查询提供额外的语义背景和关系信息; 步骤4相似度计算中,针对大规模文档库,优化相似度计算的效率,使用近似最近邻ANN搜索算法来加速查询向量与文档向量之间的相似度计算,减少计算复杂度和响应时间; 5检索到的相关文档与原始查询一起输入到基于Transformer架构的生成模型中,生成模型利用这些输入生成最终的回答或文本; 其中,基于Transformer架构的生成模型在处理基于RAG技术的任务时,包括以下内容: 1输入表示与编码; 输入序列构建:将查询和检索到的相关文档拼接成一个输入序列,确保每个文档以及查询都使用[CLS]和[SEP]特殊标记标识开头和结束; 词嵌入和位置编码:将输入序列中的每个词或子句转换为词嵌入向量,并添加位置编码,以保留词的位置信息; 2多头自注意力机制; 编码器堆叠:使用多层Transformer编码器堆叠,每一层包含多头自注意力机制和前馈神经网络; 自注意力计算:对于每个位置,通过计算注意力分数来确定该位置与序列其他部分的关联性;自注意力计算或采用考虑文本的局部和全局信息,以及不同头之间的交互; 注意力权重计算:通过对注意力分数进行softmax归一化,计算出每个位置对应其他位置的权重,以获得更全面的上下文理解; 3上下文增强; 特征整合:将通过自注意力机制计算得到的上下文信息整合到每个位置的表示中;这些表示包含原始词嵌入的简单组合,还包含整个输入序列的语义信息; 信息传递:通过多层编码器的堆叠,每一层都能进一步传递和整合上下文信息;每个层次都通过自注意力机制增强表示的丰富程度; 4生成模型输出; 解码器处理:在编码器堆叠后,使用Transformer解码器部分处理编码器的输出,生成回答或文本; 上下文利用:解码器通过自注意力机制对编码器输出进行进一步的上下文利用,确保生成的文本与输入序列中的查询和文档内容保持一致和相关; 在步骤S2中,按照数据导入的时间顺序排队转成向量化的数值,包括: 文本清洗:去除文档中的噪声; 分词和规范化:将文档文本分词,并进行规范化处理; 所述分词包括:对于复合词或者语言中的长词,使用子词分割技术BPE处理未登录词OOV和词库外词OOD; 向量化表示:使用预训练的语言模型将处理后的文档转化为固定维度的向量; 在训练阶段,文档处理模型和向量模型联合优化,使整个RAG系统协调一致; 联合训练:在训练过程中,优化文档向量和查询向量,使得相关文档和查询在向量空间中接近; 所述文档处理模型优化包括: 使用监督学习、自监督学习的方法,通过最小化文档语义向量与其对应标签或自动生成的查询向量之间的损失,优化文档处理模型;使用基于Transformer的模型结构,通过反向传播算法调整模型参数,使得文档语义向量更好地捕捉文档的语义信息; 所述向量模型优化包括: 使用监督学习、自监督学习的方法,通过最小化查询向量与其相关文档语义向量之间的损失,来优化向量模型;确保查询向量能够有效地反映查询的语义含义,并与相关文档的语义向量在向量空间中接近; 对比学习:使用对比学习的方法进一步优化向量模型,使得相似的文档和查询向量彼此靠近,而不相关的文档和查询向量彼此远离; 同批对比损失:将查询向量和其相关文档的语义向量作为正样本,将查询向量和非相关文档的语义向量作为负样本;通过调整模型参数,使得正样本之间的相似度增大,负样本之间的相似度减小; 自监督对比学习:利用自动生成的对比任务来学习语义空间中的向量表示,包括使用同一个文档生成器来生成两个不同版本的文档,然后使用文档处理模型和向量模型来比较这两个版本的文档,在此过程中优化模型参数; 在步骤S3中,创建机器人应用,关联知识库,包括: 创建机器人ID、名称、图标、简介以及角色设定,并选中第S1步骤中创建的知识库进行绑定,绑定多个知识库;设置是否在前台显示对话上下文、是否在前台显示引用内容、是否公开机器人选项;设定AI接口、相似度、单次搜索数量、空搜索回复、欢迎语、底部标识、菜单项;启用数字人形象,绑定数字人视频进行拟人播报; 在步骤S4中,发布机器人应用,进行聊天,包括: 针对内容缺失,当知识库中没有实际答案时,通过清理数据源、修正问题答案的方式处理RAG系统提供的合理但不正确的答案,并设计提示鼓励模型承认局限性并透明地传达不确定性;中清理数据源即删除知识库中的数据列表;修正问题答案即修改知识库中的问答对内容; 针对错过排名靠前文档,通过调整chunk_size和similarity_top_k超参数,在将检索结果发送到LLM之前进行重新排序,解决重要文档不出现在系统检索组件返回的顶部结果,导致正确答案被忽略; 通过调整chunk_size和similarity_top_k超参数,在将检索结果发送到LLM之前进行重新排序,包括: 使用更高级的相似度度量; 加入上下文信息,包括块之间的关联性; 使用回归模型或分类模型进行重新排序; 针对处理非结构化文档的困难,通过光学字符识别OCR技术,识别非结构化文档中的有效信息,提取并导入RAG系统知识库中进行数据训练; 通过光学字符识别OCR技术,识别非结构化文档中的有效信息,提取并导入RAG系统知识库中进行数据训练,包括: 首先进行图像预处理:灰度化,将图像转换为灰度图;二值化,将灰度图转换为黑白图; 降噪,移除图像中的噪点;校正倾斜,矫正图像中的文字倾斜; 然后使用Tesseract识别引擎进行识别,对识别出的文本进行后处理,提取有效信息; 后处理:去除噪音,删除无关或错误的文本;分段,将文本按段落、句子或其他结构分割;使用自然语言处理NLP技术从文本中提取结构化信息,包括命名实体识别NER、关键词提取。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛道可云网络科技有限公司,其通讯地址为:266000 山东省青岛市市北区台柳路267号保利天珺6号楼1203;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。