哈尔滨工业大学张伟男获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利自验证式的探索预训练语言模型中明喻知识的方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118364103B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410461572.3,技术领域涉及:G06F16/353;该发明授权自验证式的探索预训练语言模型中明喻知识的方法及其系统是由张伟男;马龙轩;柯昌鑫;刘挺设计研发完成,并于2024-04-17向国家知识产权局提交的专利申请。
本自验证式的探索预训练语言模型中明喻知识的方法及其系统在说明书摘要公布了:本发明属于自然语言处理技术领域,具体涉及一种自验证式的探索预训练语言模型中明喻知识的方法及其系统。步骤1、构建多级明喻识别数据集;步骤2、创建多级明喻识别任务,帮助PLMs评估明喻质量;步骤3、将多级明喻识别分数融合进明喻生成任务。本发明为解决现有预训练语言模型无法很好评价明喻好坏从而无法很好地探索明喻知识的问题。
本发明授权自验证式的探索预训练语言模型中明喻知识的方法及其系统在权利要求书中公布了:1.一种自验证式的探索预训练语言模型中明喻知识的方法,其特征在于,所述方法包括以下步骤, 步骤1、构建多级明喻识别数据集;具体为,构建具有多个明喻级别的明喻数据;利用明喻数据训练PLMs为每个级别分配质量分数 步骤2、创建多级明喻识别任务,帮助PLMs评估明喻质量;具体为,采用多级对比学习方法来训练PLM;对于每个明喻层次,分配一个介于0和1之间的参考分数;在训练过程中,MLSR模型学习预测输入序列的分数;训练目标是最小化预测分数与参考分数之间的距离;此处假设参考质量分数与明喻层次之间存在线性关系,是便于让模型自动学习不同层次的质量分数; 在使用BERT作为骨干结构时MLSR的模型结构;第一个输出位置被用作序列表示;当将的方法应用于其他具有解码器结构的PLM时,第一个解码向量被用作输入表示以计算MLSR损失;分别使用Sigmoid函数和tanh函数;将每个明喻层次分别表示为Di;然后,使用分离损失和紧凑性损失来训练MLSR模型; 分离损失通过区分代表不同明喻层级的质量分数来区分不同的明喻层次;对于每个明喻层次i,首先计算一个中心分数再计算不同明喻层次之间的分离损失; 紧凑性损失将同一明喻层次中的示例压缩在一起,以避免每个层次的异常值; 步骤3、将多级明喻识别分数融合进明喻生成任务; 当使用BERT作为骨干网络时,SI和SG任务与BERT中的MLM任务相同;其中BERT学习恢复被掩蔽的属性或喻体;当对SISG任务使用具有解码器结构的其他PLMs时,提供给PLMs一个任务指示和被遮蔽的序列,并要求PLMs生成缺失的组件; 训练一个单一的PLM来处理所有三个明喻任务,即MLSR、SI和SG;损失函数为在SISG测试中,遵循先前的工作,PLMs从候选池中选择缺失的属性或喻体; 在使用BERT进行实验时,使用BERT的遮蔽词预测头来计算每个候选的概率;具有最高概率的候选将被选为最终选择;当使用其他具有解码器结构的大型PLMs进行SISG任务时,提供一份指示,并要求PLMs生成缺失的组件;每个候选的概率是生成概率; 为了利用MLSR结果进行自验证,将每个候选项连接到输入序列作为新输入;然后模型可以计算该候选的MLSR分数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励