Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 世纪开元智印互联科技集团股份有限公司杨成成获国家专利权

世纪开元智印互联科技集团股份有限公司杨成成获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉世纪开元智印互联科技集团股份有限公司申请的专利一种提升模型训练样本质量的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121434790B

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511998630.7,技术领域涉及:G06F18/214;该发明授权一种提升模型训练样本质量的方法及系统是由杨成成设计研发完成,并于2025-12-29向国家知识产权局提交的专利申请。

一种提升模型训练样本质量的方法及系统在说明书摘要公布了:本申请公开了一种提升模型训练样本质量的方法及系统,涉及数据处理领域,方法包括:响应于对客户咨询文本的标注操作,获取新标注样本,所述新标注样本包括客户咨询文本及其被赋予的意图分类标签;调用预设的文本嵌入模型,将所述客户咨询文本转化为对应的文本向量;将所述文本向量与向量数据库中存储的、已标注的历史样本向量进行比对,依次执行标签内相似性校验与跨标签区分度校验,根据校验结果对新标注样本进行处理:若校验通过,则将所述新标注样本及其文本向量存储至所述向量数据库;若任一项校验未通过,则生成包含具体语义冲突信息的预警提示并暂停入库流程,由标注人员依据该预警提示进行后续操作。

本发明授权一种提升模型训练样本质量的方法及系统在权利要求书中公布了:1.一种提升模型训练样本质量的方法,应用于印刷客户咨询意图分类模型,其特征在于,所述方法包括以下步骤: 步骤S1:响应于对客户咨询文本的标注操作,获取新标注样本,所述新标注样本包括客户咨询文本及其被赋予的意图分类标签; 步骤S2:调用预设的文本嵌入模型,将所述客户咨询文本转化为对应的文本向量; 步骤S3:将所述文本向量与向量数据库中存储的、已标注的历史样本向量进行比对,依次执行标签内相似性校验与跨标签区分度校验,其中,所述标签内相似性校验用于防止单一标签下语义近似的样本过度聚集,所述跨标签区分度校验通过计算所述文本向量与其他标签历史样本向量之间的语义距离,并判断所述语义距离是否均大于预设阈值来实现;所述标签内相似性校验具体包括: 从向量数据库中检索出与当前新标注样本具有相同标签的所有历史样本向量; 计算当前文本向量与各所述历史样本向量之间的语义相似度; 统计语义相似度不低于第一预定阈值的历史样本数量; 判断该数量是否超过一预设的数量上限; 若未超过,则所述标签内相似性校验通过;若超过,则校验未通过,并生成指示标签内样本语义冗余的第一预警信息; 所述跨标签区分度校验在所述标签内相似性校验通过后执行,具体包括: 从向量数据库中检索出标签与当前新标注样本不同的历史样本向量; 计算当前文本向量与各所述不同标签的历史样本向量之间的语义距离; 判断是否存在至少一个所述语义距离不大于第二预定阈值; 若所有语义距离均大于所述第二预定阈值,则所述跨标签区分度校验通过; 若存在至少一个语义距离不大于所述第二预定阈值,则校验未通过,并生成指示与至少一个其他标签下样本区分度不足的第二预警信息,所述第二预警信息包括相关样本的标签及文本内容提示; 当所述跨标签区分度校验未通过时,所述方法还包括: 接收标注人员针对所述第二预警信息输入的确认指令; 响应于所述确认指令为强制提交,将所述新标注样本标记为待复核状态后存入向量数据库,并关联记录提交理由; 步骤S4:根据校验结果对新标注样本进行处理:若校验通过,则将所述新标注样本及其文本向量存储至所述向量数据库;若任一项校验未通过,则生成包含具体语义冲突信息的预警提示并暂停入库流程,由标注人员依据该预警提示进行后续操作。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人世纪开元智印互联科技集团股份有限公司,其通讯地址为:250101 山东省济南市高新区凤凰路2116号海信创智谷1楼23层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。