中通服和信科技有限公司孙剑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中通服和信科技有限公司申请的专利一种基于大语言模型的中文超长文本的分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116821348B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310964878.6,技术领域涉及:G06F16/35;该发明授权一种基于大语言模型的中文超长文本的分类方法是由孙剑;周慰;丁雪芹;施方雄;刘畅;任俊侠设计研发完成,并于2023-08-02向国家知识产权局提交的专利申请。
本一种基于大语言模型的中文超长文本的分类方法在说明书摘要公布了:本发明公开了一种基于大语言模型的中文超长文本的分类方法,包括以下步骤:通过输入设备导入文本内容;通过预设的大型语言模型对文本内容进行筛选,得到预分类文本;提取预分类文本内容中的至少两个关键词,并导入历史数据中的文本归类信息表,判断文本归类信息表中预设词汇在关键词中的占有量,并根据占有量将关键词替换成文本归类信息表中的预设词汇;本发明以大型语言模型为基础,提取关键词,并根据关键词在历史文本归类信息表中的分类信息,判定文本的分类信息,该分类方法不需要对文本进行整体解读,只需对提取的关键词进行分析处理即可,可以极大降低计算机的运算量,从而提升文本分类的速度和效率。
本发明授权一种基于大语言模型的中文超长文本的分类方法在权利要求书中公布了:1.一种基于大语言模型的中文超长文本的分类方法,其特征在于,包括以下步骤: S1、通过输入设备导入文本内容; S2、通过预设的大型语言模型对文本内容进行筛选,得到预分类文本; S3、提取预分类文本内容中的至少两个关键词,并导入历史数据中的文本归类信息表,判断文本归类信息表中预设词汇在关键词中的占有量,并根据占有量将关键词替换成文本归类信息表中的预设词汇; S4、根据文本归类信息表中预设词汇的所在的类别对文本进行归类,从而得到文本归类信息; S5、导出文本归类信息,并将文本归类信息发送至预设终端; 所述预分类文本包括主标题分类文本,关键词包括第一关键词,所述S3具体包括: S31、获取主标题分类文本,并对预分类文本进行去噪; S32、获取主标题分类文本中的多个第一关键词,先对多个第一关键词进行分类,再对多个第一关键词进行统计; S33、导入历史数据中的文本归类信息表,在文本归类信息表中逐个对第一关键词进行检索; S34、根据检索结果,对文本归类信息表中不同类别中占有的第一关键词的数量进行统计; S35、计算文本归类信息表中预设词汇在多个第一关键词中的占有量Q,具体计算过程为: Q=A1A2其中,A1为文本归类信息表中预设词汇在多个第一关键词中共有词汇的数量,A2为多个第一关键词的总数量; 当Q≥预设阈值B时,则关键词在文本归类信息表的同一类别中的数量多,文本内容与该类别的相似程度大,将第一关键词替换成对应类别的预设词汇; 当Q<预设阈值B时,则关键词在文本归类信息表的同一类别中的数量少,文本内容与该类别的相似程度小,关键词数量过少,不能对文本内容进行分类; 所述预分类文本还包括摘要分类文本,关键词还包括第二关键词,当Q<预设阈值B时,S3还包括如下步骤: S301、获取摘要分类文本,提取摘要分类文本中的第二关键词; S302、筛选并统计第二关键词数量; S303、计算第二关键词的词频P1,具体计算过程如下: P1=C1C2其中,C1为其中一个第二关键词的个数,C2为第二关键词的总数量; S304、根据词频P1对第二关键词进行分级并确定第二关键词的优先级,当词频P1在预设数值范围以上时,为高级预选词,当P1在预设数值范围内时,为中级预选词,当词频P1在预设数值范围以下时,为低级预选词;并规定优先级为高级预选词>中级预选词>低级预选词; S305、按照优先级排序依次将第二关键词纳入第一关键词内,并计算文本归类信息表中预设词汇在多个第一关键词中的占有量Q,以提升文本分类的精准度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中通服和信科技有限公司,其通讯地址为:230000 安徽省合肥市高新科技园天柱路和信科技楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励