Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学张引获国家专利权

浙江大学张引获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利一种融合多信息的问题生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116882393B

龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310255049.0,技术领域涉及:G06F40/284;该发明授权一种融合多信息的问题生成方法及装置是由张引;刘流设计研发完成,并于2023-03-16向国家知识产权局提交的专利申请。

一种融合多信息的问题生成方法及装置在说明书摘要公布了:本发明公开了一种融合多信息的问题生成方法及装置,首先对段落上下文和答案所在句单独编码,并基于门控注意力有效融合段落上下文和答案所在句的信息,生成与上下文和答案更相关的问题。本发明针对命名实体识别任务和词性标签识别任务分别训练识别网络,得到语言学特征信息的表示并应用到编码器中,帮助问题生成模型更有效地利用语言学特征信息。本发明方法通过在预训练语言模型中结合答案实体类别信息实现问题类型预测,并将预测的问题类型信息应用到解码阶段,让生成问题的问题类型更准确。本发明方法缓解了现有方法生成的问题与给定的上下文和答案相关性不高的情况,更加有效地利用上下文中的关键信息以及深度联系,从而更好地生成问题。

本发明授权一种融合多信息的问题生成方法及装置在权利要求书中公布了:1.一种融合多信息的问题生成方法,其特征在于,该方法包括以下步骤: 1数据处理:获取问题生成数据集进行处理,包括大小写转换、对答案位置进行标注、提取答案所在句、抽取问题类型以及对所有文本进行命名实体识别和词性标签识别,构建命名实体识别数据集和词性标签识别数据集,其中答案位置标注和命名实体标注采用BIO标注法;根据段落上下文、答案实体类别和问题类型构建问题类型预测数据集,其中问题类型包含“what”、“who”、“how”、“when”、“which”、“where”、“why”和“others”八种; 2语言学特征信息和问题类型信息获取:构建语言学特征表示模型,整体由预训练语言模型和最后的CRF层构成;其中预训练语言模型用于获取输入文本的编码表示,CRF用于预测标签;语言学特征表示模型针对命名实体识别任务和词性标签识别任务,分别使用步骤1中得到的命名实体识别数据集和词性标签识别数据集进行训练,得到命名实体识别和词性标签识别对应的语言学特征表示模型;在训练结束后,使用训练好的语言学特征表示模型的隐藏状态作为命名实体或词性标签的语言学特征信息表示;构建基于预训练语言模型的问题类型预测模型,该预测模型的输入为段落上下文以及答案实体类别信息,输出为步骤1中的八种问题类型; 3融合答案所在句信息和语言学特征信息的编码:问题生成模型整体为编码器-解码器架构,该步骤为模型的编码阶段,编码器采用双向LSTM;编码阶段输入包括三个部分,段落级上下文Q,答案X和答案所在句T;首先获取段落中每个词的词嵌入表示;然后将词嵌入表示、基于步骤1中得到的答案位置编码和步骤2中得到的语言学特征信息表示三者拼接得到最终的词表示,之后使用双向LSTM分别对包含了词表示的段落上下文和答案所在句子进行编码,得到段落级隐藏表示和答案所在句的隐藏表示;基于门控注意力机制进行对段落级隐藏表示和答案所在句的隐藏表示进行融合,具体为:首先基于段落级隐藏表示和编码后的答案所在句表示计算注意力匹配表示,然后将段落级隐藏表示与注意力匹配表示结合,形成新的注意力匹配增强的表示,最后通过可学习的门控向量选择原始段落隐藏表示和新的注意力匹配增强表示之间的信息,从而得到最终的段落编码表示; 4问题生成模型解码:该步骤为问题生成模型的解码阶段,解码器采用LSTM;根据步骤3中得到的段落编码表示和每个解码步骤中先前生成的词,通过结合注意力机制和最大输出指针机制来生成问题;在生成第一个词的时候,利用步骤2中得到的问题类型预测模型计算问题类型,若预测的问题类型为“others”,则不影响该步骤的解码过程,若为其他七种类型,则将该问题类型作为第一个生成词; 5生成与上下文和答案相关的问题:给定新的段落级上下文和答案,进行步骤1中的数据处理,通过训练好的语言学特征表示模型获取语言学特征信息,并通过训练好的问题类型预测模型得到问题类别信息,再将段落上下文、答案、答案所在句、语言学特征信息的表示和问题类型输入到通过步骤3和步骤4训练好的问题生成模型,最终生成与该上下文和答案相关的问题。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。