Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京三维天地科技股份有限公司金震获国家专利权

北京三维天地科技股份有限公司金震获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京三维天地科技股份有限公司申请的专利一种基于机器学习的数据分割方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121009890B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511102039.9,技术领域涉及:G06F40/289;该发明授权一种基于机器学习的数据分割方法及系统是由金震;张京日;苏魁;徐伟设计研发完成,并于2025-08-07向国家知识产权局提交的专利申请。

一种基于机器学习的数据分割方法及系统在说明书摘要公布了:本发明提供了一种基于机器学习的数据分割方法及系统,包括:收集历史物料数据并进行标注,构建标注语料库,并对标注语料库进行处理并存储至Elasticsearch;输入目标描述,并基于Elasticsearch召回与目标描述同类别物料对应的字段短语集,且在字段短语集中遍历目标描述,匹配输出第一目标字段;采集目标描述中未匹配的剩余信息,并对剩余信息进行双向分词处理,获得最终分词;计算最终分词与字段短语集中的各字段短语的相似度,并将剩余信息分配至相似度最高的第二目标字段;对第一目标字段与第二目标字段进行冲突检测,并当通过冲突检测时,输出目标描述的结构化格式。有利于提高语义匹配准确率以及分词识别效率。

本发明授权一种基于机器学习的数据分割方法及系统在权利要求书中公布了:1.一种基于机器学习的数据分割方法,其特征在于,包括: 步骤1:收集历史物料数据并进行标注,构建标注语料库,并对标注语料库进行处理并存储至Elasticsearch; 步骤2:输入目标描述,并基于Elasticsearch召回与目标描述同类别物料对应的字段短语集,且在字段短语集中遍历目标描述,匹配输出第一目标字段; 步骤3:采集目标描述中未匹配的剩余信息,并对剩余信息进行双向分词处理,获得最终分词; 步骤4:计算最终分词与字段短语集中的各字段短语的相似度,并将剩余信息分配至相似度最高的第二目标字段; 步骤5:对第一目标字段与第二目标字段进行冲突检测,并当通过冲突检测时,输出目标描述的结构化格式; 步骤1中,对标注语料库进行处理并存储至Elasticsearch,包括: 基于预设算法提取标注语料库中各字段的第一高频短语集; 计算第一高频短语集中各短语的短语词频以及各短语的TF-IDF值,同时,根据计算结果确定第一高频短语集中的停用词,并进行过滤,获得第二高频短语集; 将第二高频短语集进行结构化处理,并存储至Elasticsearch,同时,在Elasticsearch中建立倒排索引。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京三维天地科技股份有限公司,其通讯地址为:100000 北京市海淀区西四环北路119号A座3层309室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。