中国科学院文献情报中心刘秀敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院文献情报中心申请的专利基于大模型的电池性能数据自动提取系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119849618B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411913517.X,技术领域涉及:G06N5/025;该发明授权基于大模型的电池性能数据自动提取系统是由刘秀敏;胡懋地;钱力设计研发完成,并于2024-12-24向国家知识产权局提交的专利申请。
本基于大模型的电池性能数据自动提取系统在说明书摘要公布了:本发明提供了基于大模型的电池性能数据自动提取系统,涉及数据提取技术领域,包括:文献解析模块,用于读取并解析电池相关的科学文献的PDF文档,生成json数据;数据预处理模块,用于对所述json数据进行语义分块并将同一语义内容的文本分割成短文本块;电池性能数据抽取模块,用于基于预训练大语言模型,利用多轮对话及自我验证策略从所述短文本块中抽取电池性能数据;电池性能数据结构化输出模块,用于将所述电池性能数据结构化输出到excel表格。本发明解决了现有的手动或半自动化的数据提取方式,在面对复杂的电池性能数据时存在遗漏或错误识别,导致提取结果的准确性不足的技术问题。
本发明授权基于大模型的电池性能数据自动提取系统在权利要求书中公布了:1.基于大模型的电池性能数据自动提取系统,其特征在于,所述系统包括: 文献解析模块,用于读取并解析电池相关的科学文献的PDF文档,生成json数据; 数据预处理模块,用于对所述json数据进行语义分块并将同一语义内容的文本分割成短文本块; 电池性能数据抽取模块,用于基于预训练大语言模型,利用多轮对话及自我验证策略从所述短文本块中抽取电池性能数据; 电池性能数据结构化输出模块,用于将所述电池性能数据结构化输出到excel表格; 其中,所述数据预处理模块,包括: 抽取准确率分析单元,用于根据待抽取知识属性,分析历史抽取记录的不同文本块大小的知识抽取准确率; 文本块大小寻优单元,用于根据所述知识抽取准确率,以及所述大语言模型的文本块大小约束区间对所述待抽取知识属性进行文本块大小寻优,得到目标文本块大小; 语义分块单元,用于根据所述目标文本块大小对所述json数据进行语义分块; 其中,所述电池性能数据抽取模块,包括: 文本内容分析单元,用于将所述短文本块输入所述大语言模型进行文本内容分析,判断是否包含电池性能数据; 自我验证单元,用于若包含,则通过与大语言模型的多轮对话抽取电池性能的多项性能属性信息,并在每轮对话后,对抽取的性能属性信息进行自我验证; 属性信息输出单元,用于当自我验证全部通过时,输出所述多项性能属性信息,作为所述电池性能数据; 其中,所述自我验证单元,还包括: 多项性能属性信息获取通道,用于通过多轮对话,依次抽取电池性能数值、电池性能数值单位、电池性能材料名称、循环次数,作为所述多项性能属性信息; 其中,所述自我验证单元,还包括: 空集检测通道,用于当不可为空的性能属性信息的抽取结果为空集时,将抽取的性能属性信息作为不完整数据进行丢弃处理,并终止对话,其中,不可为空的性能属性信息包括但不限于电池性能数值、电池性能材料名称; 其中,所述自我验证单元,还包括: 第一验证对话通道,用于抽取所述电池性能数值,并提问大语言模型,对所述电池性能数值是否与电池性能正关联进行验证对话; 第二验证对话通道,用于若回答是,抽取所述电池性能数值单位,并提问大语言模型,对所述电池性能数值单位是否与电池性能和电池性能数值正关联进行验证对话; 第三验证对话通道,用于若回答是,抽取所述电池性能材料名称,并提问大语言模型,对所述电池性能材料名称是否与电池性能和电池性能数值正关联进行验证对话; 第四验证对话通道,用于若回答是,抽取所述循环次数,其中包括循环次数数据及单位信息,并提问大语言模型,对所述循环次数数据及单位信息是否与循环次数及电池性能数值正关联进行验证对话; 数据输出通道,用于若回答是,输出所述电池性能数值、电池性能数值单位、电池性能材料名称、循环次数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院文献情报中心,其通讯地址为:100190 北京市海淀区中关村北四环西路33号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励