深圳市中农网有限公司孙炜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市中农网有限公司申请的专利基于大规模语料库的农产品数据空间平台构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120086308B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510570649.5,技术领域涉及:G06F16/31;该发明授权基于大规模语料库的农产品数据空间平台构建方法及系统是由孙炜设计研发完成,并于2025-05-06向国家知识产权局提交的专利申请。
本基于大规模语料库的农产品数据空间平台构建方法及系统在说明书摘要公布了:本发明涉及农产品数据管理技术领域,一种基于大规模语料库的农产品数据空间平台构建方法及系统,包括:获取农产品文本集,对农产品文本进行分割,得到农产品句集,计算农产品句集的综合关键值集,根据综合关键值集,得到关键农产品文本,对关键农产品文本进行重叠分割,得到农产品文本片段集,基于农产品文本片段集,得到关联特征向量,汇总及合并关联特征向量,得到目标农产品向量集,利用目标农产品向量集执行数据结构化,得到农产品结构数据集,基于农产品结构数据集,得到农产品数据空间平台。本发明可提高农产品数据平台构建的效率,及农产品数据平台中农产品数据的关联性。
本发明授权基于大规模语料库的农产品数据空间平台构建方法及系统在权利要求书中公布了:1.一种基于大规模语料库的农产品数据空间平台构建方法,其特征在于,所述方法包括: 接收数据平台构建指令,基于数据平台构建指令确定语料库渠道集,在语料库渠道集中依次提取语料库渠道; 在语料库渠道中获取农产品文本集,并在农产品文本集中依次提取农产品文本,其中,农产品文本包括农产品介绍文章; 对农产品文本进行分割,得到农产品句集,对农产品句集中的每个农产品句均执行多维关键值分析,得到排序关键值集、信息关键值集及标题关键值集,并基于排序关键值集、信息关键值集及标题关键值集,计算农产品句集的综合关键值集; 所述对农产品句集中的每个农产品句均执行多维关键值分析,得到排序关键值集、信息关键值集及标题关键值集,包括: 对农产品句集执行段落划分,得到多个段落农产品句集,其中,在同一个段落农产品句集中的段落农产品句来自同一个段落; 对多个段落农产品句集中的段落农产品句集均执行以下操作: 确认出段落农产品句集所在的农产品段落,并统计农产品段落在农产品文本中的段落序号; 依次提取段落农产品句集中的段落农产品句,统计段落农产品句在农产品段落中的语句序号,其中,语句序号为段落农产品在农产品段落中的位置; 汇总段落农产品句集中每个段落农产品句对应的语句序号,得到语句序号集,识别语句序号集中的中位语句序号; 基于中位语句序号及语句序号集,计算语句排序值集; 汇总多个段落农产品句集中每个段落农产品句集对应的段落序号,得到多个段落序号,识别多个段落序号中的中位段落序号,基于中位段落序号及多个段落序号,计算多个段落排序值; 基于多个段落排序值及语句排序值集,计算农产品句集中每个农产品句的排序关键值,得到排序关键值集; 对农产品句集进行信息内容分析,得到信息关键值集,对农产品句集进行标题关联分析,得到标题关键值集; 根据预设的标准关键值及综合关键值集,在农产品句集中筛选出关键农产品句集,合并所述关键农产品句集,得到关键农产品文本,并对关键农产品文本进行重叠分割,得到农产品文本片段集; 将所述农产品文本片段集输入至预获取的Longformer模型,得到农产品特征向量,并将农产品特征向量输入至预训练的LSTM网络,得到关联特征向量; 汇总所述农产品文本集中每个农产品文本对应的关联特征向量,得到关联特征向量集,合并语料库渠道集中每个语料库渠道对应的关联特征向量集,得到目标农产品向量集; 确认出语料库渠道集中的多个农产品名称,利用目标农产品向量集对多个农产品名称中的每个农产品名称均执行数据结构化,得到农产品结构数据集; 将农产品结构数据集储存至预设的数据空间平台,得到农产品数据空间平台。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市中农网有限公司,其通讯地址为:518000 广东省深圳市福田区梅林街道梅丰社区北环大道6018号华强科创广场3栋7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。