东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利层次胶囊与多视图信息融合的答案句子选择方法与装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115455162B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211113668.8,技术领域涉及:G06F16/3329;该发明授权层次胶囊与多视图信息融合的答案句子选择方法与装置是由杨鹏;李冰;易梦;孙元康;吉顺航设计研发完成,并于2022-09-14向国家知识产权局提交的专利申请。
本层次胶囊与多视图信息融合的答案句子选择方法与装置在说明书摘要公布了:本发明公开了一种层次胶囊与多视图信息融合的答案句子选择方法与装置。首先,对互联网中的包含多个答案的问题文本进行采集和预处理;接着,采用层次胶囊网络,通过其渐进聚合的特征,对编码输出的表征进行信息聚合和单词聚合,保证了有效信息的准确传递,且能使用同一特征进行参数传递;然后,为了解决微调步骤的不稳定性和使用预训练模型的最终输出仅能预测单一标签的问题,通过使用多视图信息融合方法,计算整个BERT编码中间层输出的权重来对学习信息进行加权。本发明能够改善以往答案句子选择方法中忽略了模型内部多层中间输出对答案句子选择的影响、仅能预测单一结果等问题,进而提升答案句子选择的准确性和高效性。
本发明授权层次胶囊与多视图信息融合的答案句子选择方法与装置在权利要求书中公布了:1.层次胶囊与多视图信息融合的答案句子选择方法,其特征在于,包括以下步骤: 步骤1:问答对文本采集通过互联网采集包含多个答案的问题文本与答案文本,积累样本数据集;数据集中的每条样本包括网络文本中的问题和答案;分割数据集形成训练集、验证集和测试集; 步骤2:数据预处理对数据集中每一个样本进行预处理,并构造三元组数据,一个三元组数据包括问题文本,答案文本和答案文本所对应的标签; 步骤3:模型训练首先将问题和答案进行分句处理,并利用BERT双向语言模型生成上下文嵌入向量,其中BERT模型使用大规模答案选择语料库ASNQ进行微调优化;然后在编码层,利用BERT编码器来编码双向上下文语义信息,以进一步获得词与词之间的信息依赖;接着在层次胶囊网络HCN中,通过信息聚合胶囊网络InforCaps、句段聚合胶囊网络SegCaps和类别聚合胶囊网络CateCaps共享学习同一类特征参数;信息聚合胶囊层的动态路由机制聚合每个词的高维稀疏语义,以获得词之间的初步聚类特征;在句段聚合胶囊层对聚类后的丰富词汇特征继续进行二次聚类,逐渐减少胶囊的数量,得到一个较短的句子长度,但获得丰富的信息,最后将胶囊层输入到类别胶囊层进行分类,由此保证特定对象的聚类性能;同时,在多视图信息融合层,第一步计算整个BERT编码器中所有编码中间层输出的权重并进行归一化处理,第二步利用该权重对各编码层输出的信息进行加权融合得到最终的信息表,第三步采用激活函数Relu对多视图信息融合层得到的加权信息表示进行处理并将其作为“纠正信息”添加到层次胶囊网络的最终语义表示中进行分类,由此能够增强编码器中间层信息的学习; 最后,输出层由层次胶囊网络层和多视图信息融合层的输出联合组成,使用边际损失和交叉熵损失的联合损失函数来训练所述模型; 步骤4:模型测试与答案句子选择根据训练所得到的最佳模型,对包含多个答案的问题进行答案句子选择。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励