中国建设银行股份有限公司张岩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国建设银行股份有限公司申请的专利一种文本分类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114239746B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111580707.0,技术领域涉及:G06F18/241;该发明授权一种文本分类方法及装置是由张岩设计研发完成,并于2021-12-22向国家知识产权局提交的专利申请。
本一种文本分类方法及装置在说明书摘要公布了:本申请公开了一种文本分类方法及装置,应用于人工智能技术领域,用以提升文本分类的效率。该方法包括:将待分类的文本进行拆分,得到多个子文本;针对不同格式的子文本采用不同的方法进行解析,确定各个子文本的类别;根据多个字文本的类别确定待分类文本的类别;其中,不同格式的子文本对应的解析方法可以是预先配置好的。相比于现有技术中采用单一的方式进行文本解析分类,本申请的方案提出了针对不同格式的子文本采用不同的解析方式,能够提升文本分类的准确率。
本发明授权一种文本分类方法及装置在权利要求书中公布了:1.一种文本分类方法,其特征在于,包括: 拆分待分类文本,得到至少两个子文本;所述至少两个子文本的格式相同,或者不相同;所述至少两个子文本,为通过对文本进行拆分,将不同格式的子文本拆分开而得到的; 针对任意一个子文本,根据预先配置的格式与解析方式的对应关系,确定所述任意一个子文本的格式对应的解析方式,并基于确定的所述解析方式对所述任意一个子文本进行解析,确定所述任意一个子文本的类别;所述格式包括键值对格式、长文本格式、类表格;不同的格式采用不同的解析方式; 基于所述至少两个子文本的类别,确定所述待分类文本的类别; 所述基于所述至少两个子文本的类别,确定所述待分类文本的类别,包括: 若确定拆分待分类文本得到的所述至少两个子文本的类别均为类别A,那么所述待分类文本的类别为类别A; 若确定所述至少两个子文本的类别包括N种类别,那么所述待分类文本的类别为所述N种类别; 在根据预先配置的格式与解析方式的对应关系,确定所述任意一个子文本的格式对应的解析方式之前,所述方法还包括: 将所述任意一个子文本转化为子文本向量; 将所述子文本向量输入到预先训练好的循环神经网络中,获取所述子文本向量对应的每种格式的概率;所述循环神经网络中包括embeding层,用于将输入的多个词向量转化为多个词向量序列; 根据所述子文本向量对应的每种格式的概率确定所述任意一个子文本的格式。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国建设银行股份有限公司,其通讯地址为:100033 北京市西城区金融大街25号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励