东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于动态路由和答案投票的生物医学抽取式问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521836B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310330245.X,技术领域涉及:G06F16/3329;该发明授权一种基于动态路由和答案投票的生物医学抽取式问答方法是由杨鹏;胡中坚;梁增玉;裴宏梅设计研发完成,并于2023-03-30向国家知识产权局提交的专利申请。
本一种基于动态路由和答案投票的生物医学抽取式问答方法在说明书摘要公布了:本发明公开了一种基于动态路由和答案投票的生物医学抽取式问答方法,具体如下,收集和预处理数据集,将数据集处理成抽取式问答任务所需的格式;设计一个新的路由算法对预训练模型的隐藏层进行动态路由,动态分配合适的权重;预测阶段采用一种投票机制选出更可能的正确答案,该机制能够考虑答案之间的相似度;采用预微调方法,在通用语料上预先训练模型,以提高模型在生物医学问答任务上的性能;本发明基于ALBERT添加动态路由和答案投票,并予以预训练,有效提高了模型性能。在拥有小参数量优势的前提下,能够取得不错的性能。
本发明授权一种基于动态路由和答案投票的生物医学抽取式问答方法在权利要求书中公布了:1.一种基于动态路由和答案投票的生物医学抽取式问答方法,其特征在于,所述方法包括以下步骤: 步骤1,收集并预处理数据集, 步骤2,模型训练, 步骤3,模型测试; 其中,步骤1,收集并预处理数据集,具体如下,首先收集了BioASQfactoid4b,BioASQfactoid5b,BioASQfactoid6b,BioASQfactoid9b生物医学数据集,然后又收集SQuAD公开数据集,SQuAD数据集用于预训练模型,将BioASQ的数据集处理成抽取式问答的任务格式,用于模型的训练和测试; 步骤2,模型训练,首先将模型在SQuAD通用语料上进行预训练,在预训练的过程中采用动态降低学习率的机制,然后再在BioASQ数据集上微调,具体如下: 子步骤2-1,模型输入序列,段落和问题,首先通过嵌入层,转化为嵌入向量E,然后将嵌入向量输入编码层: Hall=EncoderE 其中Hall=H1,H2,…,H12表示编码器隐藏层的输出,Hi代表第i个隐藏层的输出; 编码层:编码层就是Transformer的编码器结构,其重要部分就是注意力机制,对于给定的querymatrixQ,keymatrixK,valuematrixV,注意力机制计算如下: MultiHeadQ,K,V=[head1,…,headh]Wo 其中,Wiq、Wik、Wiv、Wo为可学习参数,是缩放因子,h是注意力头的数量,多头注意力层再接上一个前馈层,就是一个编码器结构; 子步骤2-2,对于隐藏层的输出,设要路由最后三层,取最后三层的输出,即H10,H11,H12,将这三个作为动态路由模块的输入,可以得到: H=Dynamic_RoutingH10,H11,H12 其中H代表动态路由模块的输出; 动态路由算法介绍:首先,定义三个初始权重b1,b2,b3,然后定义迭代次数r.迭代:对b1,b2,b3使用softmax计算得到三个路由值k1,k2,k3,这样路由值的总和k1,k2,k3是1,然后将最后三个隐藏层的输出向量H12,H11,H10,展平成一维向量,得到H12_f,H11_f,H10_f,计算加权和x,即k1*H12_f+k2*H11_f+k3*H10_f.通过非线性函数Squash得到y,然后更新b1,b2,b3,y乘以H12_f的转置加上原b1作为新的b1,同理得到新的b2和b3,迭代完成后,H12,H11,H10乘以各自更新的路由值并求和,作为动态路由后的输出,即k1*H12+k2*H11+k3*H10, 子步骤2-3,在动态路由后,再接一个线性层,线性层的输出维度是2, L=LinearH 其中L代表线性层的输出, 子步骤2-4,答案投票:将L输入到预输出层, A′,P=pre_outputL 其中A′表示预输出的答案,P代表对应的预测分数, 将A′输入答案投票模块, V=answer_votingA′ 其中V表示对应的投票分数, S=w1*P+w2*V 其中S表示最终的答案分数,然后通过输出层获取最终答案, A=outputS 其中A表示最终答案, 对于任意xi和xj,答案投票分数计算公式: 其中|xi∩xj|代表xi和xj之间的共有单词数量,|xi|代表xi的单词数量,N代表每组答案的数量; 步骤3,模型测试,将测试集输入模型,启动模型预测,模型运行后得到测试结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励