北京句子互动科技有限公司李佳芮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京句子互动科技有限公司申请的专利一种基于提示词知识检索的聊天精准应答生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120316217B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510381872.5,技术领域涉及:G06F16/3329;该发明授权一种基于提示词知识检索的聊天精准应答生成方法及系统是由李佳芮;高原;涂艳平设计研发完成,并于2025-03-28向国家知识产权局提交的专利申请。
本一种基于提示词知识检索的聊天精准应答生成方法及系统在说明书摘要公布了:本发明属于自然语言处理技术领域,且公开了一种基于提示词知识检索的聊天精准应答生成方法,具体步骤如下:步骤一:接受用户输入的数据和业务信息数据收集是指收集业务数据和对话样本数据。通过创新的图样本生成技术,能够在数据资源有限的情况下,快速构建出丰富多样的图结构样本,有效弥补了数据量的不足,并显著提升了数据的多样性和均衡性,并且通过利用图样本生成技术,能够在不依赖大量原始数据的情况下,快速生成高质量的样本,从而大大降低了数据采集和标注的成本,最后通过引入提示词机制,系统能够更准确地捕捉数据中的关键信息,并深入挖掘数据中的隐藏规律和特性,这种能力增强了系统的数据处理和分析能力。
本发明授权一种基于提示词知识检索的聊天精准应答生成方法及系统在权利要求书中公布了:1.一种基于提示词知识检索的聊天精准应答生成方法,其特征在于,具体步骤如下: 步骤一:接受用户输入的数据和业务信息 数据收集是指收集业务数据和对话样本数据,获取业务关联数据需要结合甲方提供的购买、对话逻辑自己定义;或通过现有网站提供的API接口获取对话样本数据,也称为语料和问答对,收集对话样本数据是指获取更多可标注数据的条目; 应答系统初始化时,没有真实的样本和问答对的,首先搭建一个对话模板,对话模板是一种快速生效的匹配工具,可以根据训练集抽象高质量的模板提升效果,上线这个模板所搭建的系统,进一步积累真实的对话样本数据; 当模板系统上线后,系统在云端数据产生的日志中进行收集,分析已有的与客户沟通的数据,包括客户请求、支持服务单、聊天记录,利用行业数据,将云端产品产生的日志数据直接收集到系统的数据平台里,将客户提供的素材转化成数据和知识; 步骤二:数据清理并提取实体,基于实体提取上下文语义特征 对话样本数据采集完成后需要对对话样本数据进行二次清理,基于文本提示词构建知识图谱的过程从自然语言处理技术开始,首先通过文本挖掘从大量的文档中提取实体和关系;这些实体和关系通过命名实体识别和关系抽取技术进行识别和分类,然后使用图数据库将这些信息结构化为节点和边,节点和边分别对应实体和关系,最终形成一个知识图谱;通过不断添加新的数据和关系进行扩展和更新,原始数据经过BERT处理提取句子结构特征,对序列信息特征进行分析将句子结构特征进行连接和融合,以提高意图识别性能,利用自然语言处理算法对用户的话语进行词义分析、句法结构解析和情感识别,能够追踪对话的上下文,包括之前的交流历史和话题的转变,有助于在长对话或复杂交互中更准确地捕捉用户的意图; 步骤三:根据语义信息和业务信息构建有向图结构的业务图谱 本申请所提出的检索技术依托于一个超大规模的词汇表,而实体和关系则对应于单词,通过这种方式,结合图结构蕴含的业务逻辑信息,在检索时能够将实体和关系作为单元进行联合建模,从而更准确地理解查询意图,并提供更精准的检索结果; 通过可达路径推理算法,在有向图中实体关系向量来计算目标的三联体和不同之处从目标头节点到目标尾节点的路径,选取路径的语义距离,三者所有路径中语义距离最大的路径为与循环神经网络输出ht连接在一起形成一个向量S,然后是向量S进行非线性处理,得到Rt|h的值: 式中:Mt是指向节点t的所有节点的集合,ODei为节点ei的出站,BWeit为节点ei的出站从节点ei到节点t的路径跳数;因此,对于每个节点ei在Mt中,从节点ei转移到节点ei的资源量t为: 知识中存在错误和噪声可能破坏有向图的闭环,为了提高模型的容错性,假设各节点跳到随机节点的概率相同,以及这部分资源t的随机流量为1N,其中N为节点总数; 步骤四:基于用户意图和语义信息进行意图识别 通过可达路径推理,在有向图中计算的实体关系向量,用于计算目标三联体h,r,t的语义特征及头节点h到尾节点t的路径差异,选取路径的语义距离,三者所有路径中语义距离最大的路径为与神经网络输出连接在一起形成一个向量S,然后是向量S进行非线性处理,得到RPh,r,t的值,RPh,r,t公式为: 该方法的有效性意图识别及其在实际应用中的高度相关性,其中β是非线性激活函数,Wj和bj参数可以在建模过程中进行训练、j∈{1、2},RPh,r,t的取值范围在[0,1],值越接近1置信度越高; CBMB=[Hjg,RPh,r,t] 上述公式为图分类公式,其中CBMB为拼接后的业务结构特征和语义特征,基于知识图谱的检索增强技术通过构建图模型的知识表达,将实体和关系之间的联系用图的形式进行展示,优化大语言模型检索过程中存在的幻觉,将其反馈信息优化的更贴合业务逻辑; P=softmaxWf*CBMB+bf 上述公式为意图分类公式,其中,Wf和bf分别是权重项和偏差项,P表示意图分类,使用softmax函数将输出转换为概率分布,通过图技术构建知识图谱,凭借图形格式组织和连接信息的方式,提升的全面性为用户提供更多的复杂的上下文信息,能够帮助大语言模型更好地理解实体间的关系,提升自己的表达和推理能力; 实时监控意图识别的准确性和回复的效果,以评估系统的整体性能,系统能够利用用户反馈和交互结果来学习和优化意图识别模型和回复策略,通过不断的学习和调整,系统能够适应新的用户行为和对话模式,保持其对话处理能力的先进性和有效性; 步骤五:基于用户数据所包含的意图和提示词生成反馈信息回传给用户系统处理完用户的提问后,会得出一个结果,这个结果包含了对用户意图的理解,结合意图识别和提示词重新构造输入大模型中的内容,迅速更新对话状态和用户意图的理解,这种查询方式可以为客户关系管理、风险评估和市场分析进行复杂的数据分析和决策支持,通过知识图谱的查询,企业可以快速获取关联信息,发现隐藏的模式和关系,从而提升业务洞察力和决策效率; 对结果进行实体消歧,通过文本嵌入相似度和词汇距离来移除潜在的重复项,生成的输出需要进一步的处理,以确保其符合业务逻辑和约束,对于非确定性输出,需要一个置信度阈值来确定是否为标准输出,最后系统将处理的结果以标准化的格式输出给用户。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京句子互动科技有限公司,其通讯地址为:100080 北京市海淀区成府路45号中关村智造大街G座3层302;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励