恭喜西南石油大学陈富贵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西南石油大学申请的专利基于大型语言模型的作者姓名消歧与错误分配检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119990109B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510460617.X,技术领域涉及:G06F40/232;该发明授权基于大型语言模型的作者姓名消歧与错误分配检测方法是由陈富贵;何山;陆朝阳;蔡祖磊;张学究;笪海;李佳洋设计研发完成,并于2025-04-14向国家知识产权局提交的专利申请。
本基于大型语言模型的作者姓名消歧与错误分配检测方法在说明书摘要公布了:本发明公开了一种基于大型语言模型的作者姓名消歧与错误分配检测方法,涉及分配检测技术领域。该方法包括以下步骤:S1.形成标准化学术文献数据集合;S2.生成用于表征各文本信息上下文语义关系的高维语义特征向量表示;S3.形成统一的作者身份表征向量;S4.利用原始学术文献数据集构建学术文献引用、作者与学术文献、作者与机构以及合著关系多元关系图;S5.生成初步作者身份匹配结果;S6.生成作者身份概率分布预测结果;S7.生成优化的作者身份匹配数据;S8.利用反向推理策略对作者身份匹配数据进行自动校正,形成最终作者身份归属结果。本发明提高了对署名变体的识别能力,避免因表述不同导致的身份错判。
本发明授权基于大型语言模型的作者姓名消歧与错误分配检测方法在权利要求书中公布了:1.一种基于大型语言模型的作者姓名消歧与错误分配检测方法,其特征在于,包括如下步骤:S1.从数据库中采集原始数据并构建原始学术文献数据集,对原始学术文献数据集进行预处理,形成标准化学术文献数据集合;S2.采用BERT大模型对标准化学术文献数据集合进行深度语义解析与向量编码,生成高维语义特征向量;S3.基于高维语义特征向量对各学术文献中作者署名及其上下文信息进行融合处理,形成统一的作者身份表征向量;S4.利用原始数据集构建学术文献引用、作者与学术文献、作者与机构以及合著关系多元关系图,并基于结构特征提取法提取反映学术合作网络的结构特征;S5.结合作者身份表征向量与结构特征对学术文献中的作者署名进行初步匹配与聚类,识别同一作者的多种署名变体及重名现象,生成初步作者身份匹配结果;S6.基于初步作者身份匹配结果、身份特征及结构特征,结合最大熵马尔可夫场模型,利用最大熵原理对作者身份进行概率化判定,生成作者身份概率分布预测结果;S7.依据作者身份概率分布预测结果对匹配结果进行多轮推理处理,利用动态阈值过滤策略区分高置信度匹配结果与低置信度匹配结果,并对低置信度匹配结果实施二次验证与优化,生成优化的作者身份匹配数据;该步骤包括以下分步骤:S71.根据当前的匹配结果,对S3的作者身份表征向量进行调整,随后重复步骤S5,并调整最大熵马尔可夫场模型的可学习权重参数,多次重复前述操作直至达到预设重复次数或S6的预测结果稳定;S72.根据S71的最终结果,统计出整体置信度的分布特征;将置信度高于动态阈值的匹配结果视为“高置信度”,低于该阈值的视为“低置信度”;高置信度部分直接保留使用,低置信度部分进入S73;S73.在S1和S4中添加细粒度特征,重新对低置信度部分进行S6的计算,并将重新计算结果与原始结果进行对比,后进入S74;或,采用包括图神经网络在内的辅助模型重新计算低置信度部分的结果,并将新计算结果与原始结果进行对比,后进入S74;S74.若新计算结果与原始结果匹配,则认为原始结果计算正确;若新计算结果与原始结果冲突,则引入人工审查;S8.利用反向推理策略对作者身份匹配数据进行自动校正,形成最终作者身份归属结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南石油大学,其通讯地址为:610500 四川省成都市新都区新都大道8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。