Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥高维数据技术有限公司田辉获国家专利权

合肥高维数据技术有限公司田辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥高维数据技术有限公司申请的专利基于大语言模型的特定领域文本分类标注方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118093870B

龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410233692.8,技术领域涉及:G06F16/35;该发明授权基于大语言模型的特定领域文本分类标注方法及系统是由田辉;朱鹏远;郭玉刚;张志翔设计研发完成,并于2024-03-01向国家知识产权局提交的专利申请。

基于大语言模型的特定领域文本分类标注方法及系统在说明书摘要公布了:本申请涉及一种基于大语言模型的特定领域文本分类标注方法及系统,应用于大语言模型技术领域,其包括基于待分类数据标注要求为大语言模型设计调用接口;基于所述调用接口设置大语言模型的自动标注流程;基于遗传算法对预设的初始prompt进行搜索,获取扩展后prompt;基于所述扩展后prompt以及所述自动标注流程控制大语言模型进行文本自动分类标注。本申请设计了适用于大语言模型的遗传算法,通过初始prompt生成更多的扩展后prompt,便于搜索出更优的prompt,以便于提高大语言模型文本标注的准确率,同时相对于传统标注方法来说,本申请减少了对特殊数据集的文本数量要求,大大降低了专家需要的标注文本数量,便于对文本数据进行获取,提高了特殊领域文本标注的便捷性。

本发明授权基于大语言模型的特定领域文本分类标注方法及系统在权利要求书中公布了:1.一种基于大语言模型的特定领域文本分类标注方法,其特征在于,包括: 基于待分类数据标注要求为大语言模型设计用于文本标注的调用接口,其中所述调用接口为交互对话方式接口,使得大语言模型通过输出的文本内容自主选择在完成文本分类标注任务时需要的所述调用接口,所述调用接口返回的结果也以对话的形式返回给大语言模型; 基于所述调用接口设置大语言模型的自动标注流程,包括: 初始化专有词汇表,将该领域内的专有词语均添加到表中; 尝试给出文本分类标注结果; 判断文本中是否包含不理解的词语; 调用精确查询接口,若无匹配再调用模糊查询接口; 查询同表其他数据,尝试给出分类标注结果; 查询字段相似数据,尝试给出分类标注结果; 判断不理解的词语是否能确定含义,根据分类标注结果将词语添加至专有词汇表或未知词汇表; 基于遗传算法对预设的初始prompt进行搜索,获取扩展后prompt,包括: 专家标注数据集按照预设的比例分为查找集和验证集; 通过大语言模型在所述查找集上进行搜索,对所述验证集中的数据进行标注; 将所述初始prompt中没有效果指标的prompt在所述验证集上进行效果评估,获取所述效果指标,所述效果指标:自动标注流程结束后所述验证集上的分类标注准确率; 基于所述遗传算法对初始prompt进行遗传,生成若干个新prompt,并对所述新prompt进行效果评估,获取对应的所述效果指标; 重复上述效果评估和遗传过程,直至达到预设的迭代次数; 选取效果指标最高的prompt作为正式自动标注流程中使用的prompt; 基于所述扩展后prompt以及所述自动标注流程控制大语言模型进行文本自动分类标注。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥高维数据技术有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路900号中安创谷科技园一期A1栋21楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。