电子科技大学杨世刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种问句分类方法及其应用获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112597304B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011520183.1,技术领域涉及:G06F16/35;该发明授权一种问句分类方法及其应用是由杨世刚;刘勇国;杨尚明;李巧勤;朱嘉静;张云设计研发完成,并于2020-12-21向国家知识产权局提交的专利申请。
本一种问句分类方法及其应用在说明书摘要公布了:本发明公开了一种问句分类方法,本发明通过预训练的BERT模型,利用了大规模语句下训练得到问句的词向量表示,每个词在不同的问句下都会有不用的向量表示;利用两层双向GRU网络结构处理文本序列,结合残差网络的思想,将原始的词向量与GRU网络第一层输出相结合后作为GRU第二层输入,可以加快模型的收敛速度,并利用注意力机制来关注问句的重要特征,提升问句分类精度。本发明利用GRU模型能够进一步捕获问句文本的依赖性问题,同时利用注意力机制对问句分类影响更大的特征赋予较高的权值,使得医疗问答系统中问句分类精度有进一步提升。
本发明授权一种问句分类方法及其应用在权利要求书中公布了:1.一种问句分类方法,其特征在于,包括以下步骤: S1.问句预处理:将收集到的相关领域的问句进行预处理,经过预处理的每个问句表示为q={q1,q2,...,qk,...,qn},其中qk表示问句中第k个词语,n是问句的词语总数; S2.问句的向量表示:利用预训练的BERT模型,将问句q映射表示为向量vq={x1,x2,...,xk,...,xn},其中xk表示词语qk对应的词向量; S3.建立问句分类模型:采用带注意力机制的两层双向GRU模型提取问句高级特征,前向GRU处理问句的顺序输入,后向GRU处理问句的逆序输入; S31.问句高级特征提取:利用两层双向GRU网络结构处理文本序列,结合残差网络的思想,将原始的词语向量与GRU网络第一层输出相结合后作为GRU第二层输入;利用注意力机制给GRU第二层各个时刻的输出隐藏状态分配一个权重,最终将各个时刻的隐藏状态累加起来得到最终的句子高级特征表示; S311.双向GRU模型: GRU模型的第一层t时刻的计算过程如下: 其中,xt表示GRU模型第一层t时刻输入的词向量,表示GRU模型第一层t时刻更新门的输出,rt1表示GRU模型第一层t时刻重置门的输出,表示GRU模型第一层t时刻的隐藏状态,是GRU模型第一层更新门中xt对应的参数矩阵,是GRU模型第一层更新门中上一时刻隐藏状态对应的参数矩阵,Wt1是GRU第一层重置门中xt对应的参数矩阵,是GRU模型第一层重置门中上一时刻隐藏状态对应的参数矩阵,W1是GRU模型第一层输出门中xt对应的参数矩阵,U1是GRU模型第一层输出门中重置门输出rt1与上一时刻隐藏状态点积运算结果对应的参数矩阵,σ.表示sigmoid激活函数,tanh.表示双曲正切函数,表示两个向量的点积运算; 将问句向量vq={x1,x2,...,xk,...,xn}顺序输入到前向GRU网络,得到每个词对应的t时刻的隐藏状态将问句向量逆序表示为输入到后向GRU,得到每个词对应的t时刻的隐藏状态将前和链接起来作为GRU第一层t时刻的输出利用残差网络的思想,将原始问句的词向量表示xt与GRU第一层的输出连接后的向量作为GRU第二层t时刻的输入,计算如下: 其中,表示GRU模型第二层t时刻更新门的输出,rt2表示GRU模型第二层t时刻重置门的输出,表示GRU模型第二层t时刻的隐藏状态,是GRU模型第二层更新门中xt与GRU模型第一层t时刻隐藏状态链接起来形成的向量对应的参数矩阵,是GRU模型第二层更新门中上一时刻隐藏状态对应的参数矩阵,Wt2是GRU模型第二层重置门中xt与GRU模型第一层t时刻隐藏状态链接起来形成的向量对应的参数矩阵,是GRU模型第二层重置门中上一时刻隐藏状态对应的参数矩阵,W2是GRU模型第二层输出门中xt与GRU模型第一层t时刻隐藏状态链接起来形成的向量对应的参数矩阵,U2是GRU模型第二层输出门中重置门输出rt2与上一时刻隐藏状态点积运算结果对应的参数矩阵,σ.表示sigmoid激活函数,tanh.表示双曲正切函数,表示两个向量的点积运算;同理,将前向和后向GRU t时刻的输出链接起来作为GRU第二层t时刻的输出S32.问句类别概率计算:将步骤S31得到的句子高级特征表示输入到一个线性层进行分类,输出每个类别对应的概率,概率最高的类别作为模型预测的问句类别; S33.代价函数与迭代训练:将问句数据集划分为训练集和测试集,使用训练样本对模型进行训练,最终获得问句分类模型; S4.新问句分类:对于一个用户输入的问句,经过步骤S1的预处理,然后经过步骤S2将问句向量化,输入到训练好的问句分类模型,得到分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:610000 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励