Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学史树敏获国家专利权

北京理工大学史树敏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种基于重复跨度预测的机器阅读理解方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114154515B

龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111335948.9,技术领域涉及:G06F40/35;该发明授权一种基于重复跨度预测的机器阅读理解方法是由史树敏;徐园;黄河燕设计研发完成,并于2021-11-12向国家知识产权局提交的专利申请。

一种基于重复跨度预测的机器阅读理解方法在说明书摘要公布了:本发明涉及一种基于重复跨度预测的机器阅读理解方法,属于自然语言处理机器阅读理解领域。所述方法包括:针对跨度预测形式的阅读理解任务,增加预测重复跨度的任务。该任务首先在文本段落中基于贪心算法找到所有的重复跨度,然后对包含在长跨度中的短跨度进行过滤,得到重复跨度集合之后,对每组重复的跨度,随机选择一个作为答案跨度,组内其他跨度用掩码代替。将处理过的文本输入到预训练模型中,得到表示向量,基于softmax预测掩码位置应该指向段落中的哪个跨度。在该任务上训练之后,将得到的模型在目标任务上做进一步的微调。该方法考虑到预训练模型欠缺跨度知识的问题,并利用无监督的方式构建数据,使模型可以更好地学习跨度表示,提升模型在跨度预测方面的表现。

本发明授权一种基于重复跨度预测的机器阅读理解方法在权利要求书中公布了:1.一种基于预测重复跨度的多阶段阅读理解方法,其特征在于,包括以下步骤: 步骤1:对篇章序列p做预处理,找到p中所有的重复跨度; 其中,篇章序列p表达式为:{p=w1,w2,...,wN},表示阅读理解中的篇章,该篇章中有N个单词w1,w2,...,wN,下标N为序列长度,w代表单词; 步骤2:按跨度的长度进行排序,对于索引有重合的跨度做筛选,保留重合跨度中长度最长的跨度; 步骤3:将过滤后的跨度集合打乱,对每组重复跨度的列表,随机选取一个跨度sj,ej不做任何改变,同组的其它重复跨度分别用掩码[QUESTION]代替,最终每组重复跨度形成了n-1条训练数据,n表示重复跨度的个数; 步骤4:对文本序列进行编码; 对掩码后的篇章序列p,将其词向量编码、位置编码和段编码相加输入到预训练模型bert中,bert对每个[QUESTION]位置预测出其对应的跨度sj,ej位置,预测方式如下: 其中,Ps表示跨度开始位置的概率分布,Pe表示跨度结束位置的概率分布;U表示文本序列输入到模型后得到的融合上下文信息的向量表示;表示计算跨度开始索引的权重矩阵;表示计算跨度结束索引的权重矩阵;T表示矩阵转置; 将向量表示和对应的权重矩阵相乘后做softmax运算,得到序列每个位置上的开始和结束的概率; 步骤5:使用得到的模型初始化参数,然后对目标任务数据集做数据预处理,将篇章序列p、问题序列q拼接;在序列最后添加[QUESTION]掩码标记; 其中,问题序列q表达式为:{q=w1,w2,...,wM},表示篇章对应的问题,该问题有M个单词w1,w2,...,wM,下标M为序列长度,w代表单词; 步骤6:将步骤5拼接好的序列输入到模型中,得到序列的向量表示,使用和步骤4相同的方法,计算答案跨度的开始和结束位置,使用交叉熵作为损失函数,使用梯度下降的方式更新模型参数,得到模型推理得到的答案。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。