华中农业大学赵良获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中农业大学申请的专利一种基于改进的OneRel模型的领域重叠实体关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116881452B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310790883.X,技术领域涉及:G06F16/353;该发明授权一种基于改进的OneRel模型的领域重叠实体关系抽取方法是由赵良;牛恬瑾设计研发完成,并于2023-06-29向国家知识产权局提交的专利申请。
本一种基于改进的OneRel模型的领域重叠实体关系抽取方法在说明书摘要公布了:本发明公开了一种基于改进的OneRel模型的领域重叠实体关系抽取方法,包括以下步骤:获取领域数据,对领域数据进行筛选得到利于训练模型的领域数据语句,对领域数据语句进行标注并进行特征提取得到各领域数据语句对应的三元组,将标注后的领域数据语句及其对应的三元组统合形成领域数据集;对OneRel模型进行的改进:在模型训练阶段引入FocalLoss损失函数,得到改进模型,通过FocalLoss损失函数衡量真实值与预测值之间的差异,即损失值;将领域数据集作为训练集输入改进模型;向训练后的改进模型中输入与领域数据语句格式相同的语句,得到该对应语句抽取实体关系后的三元组。本发明解决了自然语言处理任务中正负样本不均衡的问题,提高了模型的泛化能力。
本发明授权一种基于改进的OneRel模型的领域重叠实体关系抽取方法在权利要求书中公布了:1.一种基于改进的OneRel模型的领域重叠实体关系抽取方法,其特征在于,包括以下步骤: 领域数据集构建:获取领域数据,对领域数据进行筛选得到利于训练OneRel模型的领域数据语句,对领域数据语句进行标注并进行特征提取得到各领域数据语句对应的三元组,将标注后的领域数据语句及其对应的三元组统合形成领域数据集;领域数据的类型至少包括病虫害的表现症状、治疗药物、多发时期以及药物的主要成分、使用剂量、功效和副作用; 对领域数据语句进行标注并进行特征提取得到各领域数据语句对应的三元组的具体步骤为: 当某一领域数据语句中存在重叠实体,将重叠部分进行重新划分形成若干个新实体,对领域数据语句进行特征提取得到对应各新实体的三元组;其中,新实体与重叠实体在领域数据类型的划分中属于同一类型,且重叠实体从属于新实体; 当某一领域数据语句中存在超过两个类型的领域数据时,对每一类型的领域数据分别进行特征提取生成对应领域数据各类型的三元组; 对OneRel模型进行的改进:在模型训练阶段引入Focal Loss损失函数,得到改进模型,通过Focal Loss损失函数衡量真实值与预测值之间的差异,即损失值; 对OneRel模型进行的改进还包括:选取中文自然语言预训练模型MacBERT作为OneRel模型的预训练模型;对改进模型的训练:将领域数据集作为训练集输入改进模型; 对OneRel模型进行的改进还包括:通过Multi‑sample Dropout方法对OneRel模型进行训练; 向训练后的改进模型中输入与领域数据语句格式相同的语句,得到该对应语句抽取实体关系后的三元组。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中农业大学,其通讯地址为:430070 湖北省武汉市洪山区狮子山街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励