陕西师范大学吴晓军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉陕西师范大学申请的专利基于传统文化知识图谱的智能问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117093681B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310821295.8,技术领域涉及:G06F16/3329;该发明授权基于传统文化知识图谱的智能问答方法是由吴晓军;康晨迪;路纲设计研发完成,并于2023-07-06向国家知识产权局提交的专利申请。
本基于传统文化知识图谱的智能问答方法在说明书摘要公布了:一种基于传统文化知识图谱的智能问答方法,由收集传统文化知识、传统文化数据预处理、构建传统文化数据集、构建名称关系字典、构建传统文化知识图谱、构建命名实体识别网络、训练命名实体识别网络、测试命名实体识别网络、命名实体识别、意图识别、查询答案、展示问答结果步骤组成。本发明在构建传统文化知识图谱的基础上,探索了智能问答方法,提供了便捷的人机交互方式,弥补了通用搜索系统的不足,在文化知识的检索和利用上取得了良好的应用效果,实现数字文化服务,帮助用户在最短时间获取到答案,本发明的智能问答方法具有解答问题准确、速度快等优点,能实现传统文化知识的智能解答。
本发明授权基于传统文化知识图谱的智能问答方法在权利要求书中公布了:1.一种基于传统文化知识图谱的智能问答方法,其特征在于由以下步骤组成: 1收集传统文化知识 从民族民间文化资源管理系统中查找关于传统文化的知识,摘录戏曲、民歌、传统舞蹈中的名称、简介、类型、民族的数据; 2传统文化数据预处理 删除、替换没有意义的字符、乱码和无效数据,进行数据清洗,去除每条数据中不需要的字段; 3构建传统文化数据集 将传统文化知识处理成传统文化数据集Y,Y∈{an,bn,cn,dn,en,fn},其中an表示每条数据的标识符,bn表示每条数据的名称,cn表示每条数据的简介,dn表示每条数据的类型,en表示每条数据来源的民族,fn是每条数据的详细介绍,n表示每条传统文化知识数据,n取值至少为10000,将数据集Y按照7:3的比例分为训练集和测试集; 4构建名称关系字典 将数据集Y中每条数据的名称bn,输入名称字典N中,N∈{b1,b2,...,bn},将数据集Y中的关系类型包括简介c、类型d、民族e、详细介绍f,输入关系字典R中,R∈{c,d,e,f}; 5构建传统文化知识图谱 数据集Y包括如下大类: Y={Op,Fs,Nd} 其中,Op表示戏曲数据,Fs表示民歌数据,Nd表示民族舞蹈数据; 戏曲数据Op包括如下小类: Op={Oc,Om,Or} 其中,Oc表示戏曲类别数据,Om表示戏曲人物数据,Or表示戏曲经典剧目数据; 民歌数据Fs包括如下小类: Fs={Fc,Fi,Fp,Fo} 其中,Fc表示民歌类别数据,Fi表示民歌乐器数据,Fp表示民歌名人数据,Fo表示经典民乐数据; 舞蹈数据Nd包括如下小类: Nd={Nt,Np} 其中,Nt表示传统舞蹈舞种数据,Np表示舞蹈名人数据; 三个大类为知识图谱的一级本体类,九个小类为知识图谱的二级本体类,以一级本体类的数据为中心,二级本体类的数据围绕一级本体类,得到传统文化知识图谱模式层;数据集Y的名称bn为第一个实体节点,数据集Y的简介c、类型d、民族e、详细介绍f为关系节点,数据集Y中的cn、dn、en、fn为第二个实体节点,将第一个实体节点、关系节点与第二个实体节点按下式构建成三元组的输出T: T={bn,Ra,cn、dn、en、fn} 其中,bn表示三元组中第一个实体节点,Ra是表示三元组的关系节点,cn、dn、en、fn表示三元组的第二个实体节点,将数据集Y转换为40000条三元组数据,得到知识图谱的数据层,将三元组数据存储在图数据库中,构建成可视化的传统文化知识图谱; 6构建命名实体识别网络 命名实体识别网络由词嵌入层与双向长短时记忆神经网络、注意力机制层、条件随机场CRF层依次串联构成; 7训练命名实体识别网络 按下式确定交叉熵损失函数Ly,a: Ly,a=y×lna+1-y×ln1-a 其中,y为真实值,y取值为0或1,a为预测值,a∈0,1; 将训练集输入命名实体识别网络中,命名实体识别网络的学习率r∈[10-5,10-3],训练轮数为[10,15],每轮训练的批尺寸为10,优化器选择Adam,训练迭代至交叉熵损失函数Ly,a收敛; 8测试命名实体识别网络 将测试集输入到命名实体识别网络中进行测试; 9命名实体识别 将用户输入的问题文本输入训练好的命名实体识别网络进行命名实体识别,输出识别的传统文化名称S,S∈{s1,s2,...,sj},sj表示第j个传统文化名称,j取值为1~10,将传统文化名称S中的数据与名称字典N中的数据逐个比对,比对的结果输入新列表P中: P=compareS,N 其中,compare为比对函数; 10意图识别 将用户输入的问题文本K与关系数据字典R中存的关系类型逐个比对,比对结果输入新列表Q中: Q=compareK,Q 其中compare为比对函数; 11查询答案 将步骤9和步骤10的识别结果,使用图数据库的查询语言Cypher查询知识图谱中的第二个实体节点,查询结果为用户的答案; 12展示问答结果 用户在聊天窗口发送问题,脚本使用异步传输给服务器,服务器调用类的对象在后端的问答系统中查找答案,脚本接收答案并显示;对问答结果的展示进行了异常处理,如果在步骤11顺利查询到了结果,系统正常通过前端返回答案给用户;如果系统在步骤9和步骤10的识别过程中出错,系统提示用户输入错误,用户重新输入;如果出现无法连接知识库的情况,反馈用户服务器出错,联系管理员修复。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人陕西师范大学,其通讯地址为:710062 陕西省西安市长安南路199号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励